...Fast 3D 可以在0.5秒内将一张图片变成一个完美的3D模型
StabilityAI推出StableFast3D可以在0.5秒内将一张图片变成一个完美的3D模型StableFast3D建立在我们之前的TripoSR工作基础之上,但其特点是对模型进行了完全重新训练,并在架构上进行了重大改进。这些改进允许显式网格生成,并结合了快速纹理网格创建的新技术。技术报告这里,重点介绍了我们如何通过减少烘焙照明...
ECAI 2024 | 可适应点云模型:通过适应二维视觉模型进行三维点云分析
本文研究了预训练图像模型在三维点云分析中的潜力,并揭示了通过最小化微调参数可直接利用二维先验知识,并且可以超越直接在三维数据上训练的模型;本文提出了一种新颖的框架--APF,该框架通过微调二维预训练模型,使其直接应用于三维点云分析,为三维点云处理领域提供了新的研究视角和技术途径。三、方法介绍AdaptPoint...
...最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建
文中介绍了一种新方法,能够生成高分辨率的密集图像集,用于3D模型重建,无需精确相机姿态,该方法基于扩散模型和「视图丢弃」训练策略,实现了3D一致性的学习。该方法在新视角合成、单视图重建和稀疏视图重建上都展现了优异性能,超越了现有技术,同时还探索了与文本到图像模型结合的文本到3D应用。具体方法介绍MVDiffusio...
清华大学提出三维重建的新方法:O??-Recon,用2D扩散模型补全残缺...
清华大学刘永进教授团队提出物体三维重建的新方法O??2;-Recon,利用已有的2D扩散模型补全物体图像中被遮挡的区域,继而用神经隐式表面场从补全后的图像中重建完整的三维物体。该论文利用重投影机制保持填充区域的三维一致性,并且在隐式重建过程中加入CLIP损失函数监督不可见角度的语义信息,最终重建出完整且合理的...
特斯拉自动驾驶的“通用世界模型”和视频生成技术|Ashok23年CVPR...
2023年6月18日,特斯拉自动驾驶负责人阿肖克·埃卢斯瓦米(AshokElluswamy)在CVPR2023上作了一个名为“自动驾驶的基础模型”的主题演讲,解释了特斯拉正在打造的“通用世界模型”如何能够通过过往的视频片段和行动提示,生成“可能的未来”的全新视频。本视频全长约20分钟,本文字数约6千。
看透物体的3D表示和生成模型:NUS团队提出X-Ray
X-Ray表示:从相机中心开始朝向物体方向的H×W个矩阵点发射射线(www.e993.com)2024年11月13日。在每条射线方向上,逐个记录与物体的表面相交点的L个包含深度、法向量和颜色等的三维属性数据,然后将这些数据组织成L×H×W的形式,实现任意3D模型的张量表示,这就是该团队提出的X-Ray表示方法。值得注意的是,该表示形式与视频格式一样,因此可以...
【光电智造】基于多视角影像的大规模场景三维重建技术综述
背景简介三维重建是用于在现实世界中表示虚拟现实的关键技术,在计算机视觉中具有重要价值。大规模三维模型在智慧城市、导航、虚拟旅游、灾害预警和搜救任务等领域具有广泛的应用前景。但是,目前大多数基于图像的研究主要关注室内场景中三维重建的速度和准确性。虽然也有一些研究涉及大规模场景,但在这一主题上没有系统、全...
苏州创企,想要掀起一场三维重建的AI革命
去年7月份,法国科研机构Inria和德国马普所联合发表了一篇论文,详细介绍3D高斯溅射技术,这项技术使得大规模生成精细化3D模型成为可能。论文一经发出,便在计算机视觉领域引起极高关注。“这项技术具有划时代意义”,知天下创始人兼CEO宋宽博士激动地说,“高斯溅射将使三维点云算法从‘小众’变成‘大杀器’”。
“建模大业”——实景三维数字辖区
数字辖区2.0:可在此基础上通过导入桥梁、码头、趸船、航标等更精细的三维模型,接入监控视频、实景照片、业务数据、航行规则、航道规则等,成为具有规划展示功能的基础应用。数字辖区3.0:可通过接入Unity3D或Ureal等三维引擎内,添加天气、水流、运动等系统,加入船舶、车辆、人员等模型,按照应急演习、险情回放、规划设计...
单卡可用,实时渲染,书生·天际2.0助力高质量三维实景生成
在为实景三维建设提供AI技术支持的同时,天际2.0还拓展了AIGC的创意范围。天际2.0支持与AnimateDiff等多种视频生成技术进行结合,通过实景模型的“实”与AIGC视频的“虚”进行联动,改变三维实景的建筑模式,打造使用者的个性化风格,为视频编创提供更多可能。