百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
图1Robin3D在构建的百万级数据上训练(右),最终在所有3D多模态数据集上的性能超过之前的SOTA(左)Robin3D在模型上与Chat-Scene类似:使用Mask3D,Uni3D来抽3D物体级别的特征,使用Dinov2来抽2D物体级别的特征,使用物体ID来指定和定位物体。先前的方法在抽物体特征的时候,由于其物体级别的规范化(normalization),不可...
赵哥说3d
Meta发布视频生成模型MovieGenMeta发布全球最大的3d重建数据集SandboxVR大空间雷朋+Meta+AI=AR眼镜?MetaAvatars元宇宙功能更新MetaOrion世界上最先进的AR眼镜?MetaQuest3S新发布,售价299美元起谷歌公开OpenBuildings2.5D时态数据集
3D 视觉派:斯坦福具身智能人物关系图
2D视觉有ImageNet,所以发展迅速,因此建一个3D视觉领域的大规模数据集迫在眉睫。无巧不成书。不只苏昊一个人关注到3D数据匮乏的问题。2014年,普林斯顿的肖建雄、宋舒然等人发表了ModelNet——这是一个小规模的3D数据集;同时,斯坦福的两位博士生ManolisSavva与AngelChang也准备了一个小的...
为机器人赋予空间智能,UIUC团队构建多模态具身智能的3D推理系统
而在本次研究伊始,他们注意到了SQA3D这个数据集,这是一个鲜少有人注意但却非常独特和重要的数据集。此前通过使用这个数据集,人们一般用来研究3D问答效果。但是,很少有人将这个数据集用于研究情景估计和基于情景的问答效果。而通过分析领域内的已有工作,并通过与人类智能对比,他们将研究方向定为情景感知。...
对话天娱首席数据官吴邦毅AGI从桌面迈入工业应用,深挖3D空间智能...
吴邦毅:到目前为止,天娱数科布局空间智能领域已有3年多的时间,从最开始入局时的AI数字人,到如今的3D大模型、空间智能MaaS平台,我们稳步推进着空间智能技术和应用场景的创新。公司融合智者千问大模型与3D数据集、可视算法,构建了空间智能MaaS平台,实现了跨类型数据的智能解析。通过“1+1+N”模式,构建了1个全国...
天娱数科首席数据官吴邦毅:空间智能是让AGI从桌面迈入工业应用的...
“空间智能MaaS平台有两大功能,一是AI+3D可视化功能,为多个行业如消费、文旅、展会、金融、教育和影视提供虚拟3D场景和AI数字人交互的大模型服务,加快3D内容的创新和更新,增强虚拟世界的逼真度;二是AI+3D数据集功能,利用高精度3D扫描技术收集模型、动作和表情等数据,构建高质量数据集,支持3D多模态大模型的训练,并...
天娱数科:持续拓展3D空间智能平台应用边界 赋能更多产业发展
3D空间智能MaaS平台方面,也是天娱数科目前重点打造的技术平台。平台现有两大功能,一是AI+3D可视化功能,其为文旅等行业的虚拟3D场景、AI数字人交互等提供大模型服务,加速3D内容创造和迭代,让虚拟世界更真实;二是AI+3D数据集功能,平台通过多种毫米级3D扫描设备,采集3D模型、动作、表情等多类数据源构建高质量多模态数据...
天娱数科AI营销事业部总经理郑屹呈:3D空间智能技术成为文旅产业...
郑屹呈:当然。天娱数科近年来持续深耕3D空间智能技术,将3D数据集与可视算法融入基础大模型服务(MaaS),打造了面向3D空间智能领域的元享空间智能云平台,可实现跨模态数据的融合与智能解析,这些虚拟技术可以为文旅行业带来更多的智能化和个性化服务。在这一方向上,我们有几个重要的创新和布局:...
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
这一路线直接从3D数据集训练生成模型,从各种3D几何形状中提取丰富的3D先验。因此,模型可以更好地「理解」并保留几何特征。不过,这类模型也要足够大才能「涌现」出强大的生成能力,而更大的模型需要在更大的数据集上进行训练。众所周知,高质量的3D数据集是非常稀缺且昂贵的,这是原生3D路线首先...
天娱数科智者千问大模型完成备案 打造AI+3D技术竞争优势
作为一款面向3D智能领域的行业大模型,“智者千问”是天娱数科基于多源、多类、多模态高精度3D数据集,融合自然语言处理与计算机视觉算法自主研发而来。通过“智者千问”大模型和自有3D数据资产平台——元享智能云平台的有效结合,可加速3D内容的创造和迭代,为企业客户提供多元化的AI数据产品及服务,以AI+3D助力开拓企业级...