仅十亿参数!AI图像生成模型Meissonic AI在手机上就能生成高质量图像
在模型的构建过程中,研究者们经历了四个步骤:首先,他们用2亿张256x256像素的图像教授模型基本概念;接着,用1000万对经过严格筛选的图像-文本对提升其文本理解能力;然后,通过增加特殊的压缩层,使得模型能够输出1024x1024像素的图像;最后,他们进行了微调,结合人类偏好的数据来提升模型的性能。有趣的是,尽管Mei...
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR
(d)直接使用PH对齐拓扑结构会导致模型在IJB-C测试集中出现显著差异。我们的PTSA策略有效缓解了这种过拟合问题,在IJB-C数据集上评估过程中展现出更小的拓扑结构差异。基于以上的观测结论,我们可以推断出,在大规模识别数据集上训练人脸识别模型时,人脸数据的结构信息将被严重破坏,这无疑限制了人脸识别模...
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
线性RNN模型如Mamba等通过将序列表示为状态空间并利用扫描操作,以线性时间复杂度提供了序列建模的新解决方案。然而,它们可能缺乏复杂序列建模任务所需的适应性和动态特性,并且像传统序列模型一样,缺少反馈机制和自适应控制。MoE模型MoE模型通过结合专家模块,能有效处理长序列并保持计算效率,根据输入数据自适应...
大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力
我们对合成数据生成过程的进行了更加详尽的数学建模,并从期望的角度揭示了这一过程的本质,即对生成模型输出的分布的压缩;我们将合成数据的生成过程与后训练模型的泛化能力进行了连接,并提出了“反信息瓶颈”视角,解释了合成数据在训练过程中的作用机理;我们基于上述分析,从信息论的角度为合成数据训练的模型提出了...
LEAP模型低碳路径建模应用与温室气体核算实战应用培训
5、掌握LEAP软件在交通、储能、工业等方面实际建模应用。5、通过典型的案例实操分析,使学员掌握建模整体流程及实际应用及在论文写作方面的指导建议。课程大纲报名方法请各单位接此通知后,尽快确定参加培训人员,收到回执后通知报到相关事项。v因LEAP模型需提前申请使用账号,所以预参会学员确定好后,及时填写报名回执...
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)(www.e993.com)2024年10月21日。其框架内部管理三个关键角色:这三个角色通过使用特殊token,如,在模型的输出中被明确定义。LLM在生成过程中在这些角色之间无缝切换,利用其自回归能力根据上下文预测下一个token。推理过程始于提议者引入一个命题,向DAG添加一个节点。然后,由...
ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建
外层几何重建和光照模型如图4从左到右第二块所示,在外层几何的重建过程中,NU-NeRF使用了神经渲染方法进行重建。对于神经渲染过程中的每个采样点,采用了基于物理的渲染方式。具体来说就是将表面反射的颜色分为反射和折射,并分别建模它们。对于反射,NU-NeRF参考了NeRO[4]的建模方法,利用SplitSum近似方...
当虹三维体积视频建模,一键复刻《黑神话:悟空》游戏取景地!
在传统建模过程中,建模师需要通过高精度相机或3D扫描设备来获取现实世界中的三维数据,再通过数字重建与艺术加工生成3D模型,专业门槛高,建模周期长。而当虹科技的三维体积视频建模产品,只需一部随身携带的手机,就能快速生成高精度的三维模型,大幅节省几何建模、材质创建、纹理绘制等步骤的时间,为模型优化与场景调试...
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致大...
相比引入分支结构ToT和GoT,DoT不需要依赖外部控制机制或多个模型协作,训练部署更简单。秘诀就在于,DoT将LLM中的迭代推理建模为在单一模型内构建有向无环图(DAG)。DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受...
中金| AI十年展望(二十):细数2024大模型底层变化,推理优化、工程...
从中间推理角度看,不同于STaR通过prompt明确生成推理步骤,Quiet-STaR在模型内部每个标记处并行生成推理过程,实现了静默建模和内部思考。(1)并行原理生成在每个标记处生成rationale,为优化最优路径提供候选项,并嵌入标记作为学习元标记;(2)混合原理基础预测将未来文本的有无rationale预测混合,结合MLP“混合头”输出的权重...