最高降低大模型能耗95%,科学家提出优化Transformer方法,大模型有...
在效率方面,他特别关注将大模型的建模粒度从向量深入到比特层面,通过模型架构与计算架构的协同设计提升AI效率;在推理能力方面,他关注模型的编程能力和容错能力。罗鸿胤表示:“编程可以让模型通过复用推理过程提升效率,而容错能力则使得模型能够一次性输出,减少重复推理的次数,从而节省计算资源。”在未来的阶段,他计...
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
GR-2以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2官方项目页面:httpsgr2-manipulation.github.io初识GR-2:百炼出真金和许多大模型一样,GR-2的训练包括预训练和微调两个过程。如果把机器人和人做比较,预训练过程就好像是人类的“婴儿期”。而GR...
大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力
我们对合成数据生成过程的进行了更加详尽的数学建模,并从期望的角度揭示了这一过程的本质,即对生成模型输出的分布的压缩;我们将合成数据的生成过程与后训练模型的泛化能力进行了连接,并提出了“反信息瓶颈”视角,解释了合成数据在训练过程中的作用机理;我们基于上述分析,从信息论的角度为合成数据训练的模型提出了...
...语音、视觉、结构化数据全覆盖,中国移动九天善智多模态大模型...
九天善智多模态基座大模型创新实现跨领域结构化数据通用表征建模、大模型多任务训练和推理框架,覆盖通信、交通、工业、金融营销、医疗等11+行业领域,已经在多个行业深度使用。在主论坛上,九天善智多模态基座大模型对长沙橘子洲头的通信数据进行理解分析、可视化展示和未来趋势推理预测,并在仿真系统呈现了预测数据的真实...
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。其框架内部管理三个关键角色:这三个角色通过使用特殊token,如,在模型的输出中被明确定义。LLM在生成过程中在这些角色之间无缝切换,利用其自回归能力根据上下文预测下一个token。推理过程始于提议者引入一个命题,向DAG添加一个节点。然后,由...
ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建
图4.NU-NeRF方法示意图外层几何重建和光照模型如图4从左到右第二块所示,在外层几何的重建过程中,NU-NeRF使用了神经渲染方法进行重建(www.e993.com)2024年10月22日。对于神经渲染过程中的每个采样点,采用了基于物理的渲染方式。具体来说就是将表面反射的颜色分为反射和折射,并分别建模它们。
助力解决图基础模型可信任危机,科学家设计新型大模型微调方法,可...
据他介绍,目前这套范式已经在化学分子大模型和推荐系统大模型上得到验证,既能很好地处理和生成化学分子和蛋白质等图数据,又可以实现对人类行为和价值观的可信建模与对齐。如上所说,价值不以人为本,也是图基础模型面临的一种可信任危机,并且在现有的大模型场景中异常突出。“由于人类价值观包含的范围非常广泛,因此...
当虹三维体积视频建模,一键复刻《黑神话:悟空》游戏取景地!
而当虹科技的三维体积视频建模产品,只需一部随身携带的手机,就能快速生成高精度的三维模型,大幅节省几何建模、材质创建、纹理绘制等步骤的时间,为模型优化与场景调试快速筑基。当虹科技算法工程师陶哥说:“在资源有限或者需要快速建模的情境中,只要用手机拍摄一组照片或一段视频,当虹的AI算法就能在短时间内对物体...
腾讯元宝AI大模型进入3D领域,用照片就能生成3D打印级的人偶,极大...
进入“3D角色梦工厂”后,我们先选择一个3D角色,然后拍摄一张自己的头部照片,或者直接从手机相册中上传一张头部照片,经过审核后,即进入生成环节,每天可以免费生成10个3D角色。点击生成后,前面有4个模型在排队,生成需要花费6分钟的时间。生成之后,我们还会收到一条短信通知,告诉我们3D角色已经生成好了。生成的3D角色...
清华系细胞大模型登Nature子刊!能对人类2万基因同时建模,代码已开源
生命科学领域的基础大模型来了!来自清华、百图生科的团队提出的单细胞基础大模型scFoundation,登上NatureMethods。该模型基于5000万人类单细胞测序的数据进行训练,拥有1亿参数,能够同时处理约20000个基因。团队在模型架构上进行了创新,相同参数量下计算时间是传统Transformer架构的3%左右。相关研究成果也被NeurIPS2024...