想搞懂李飞飞的创业方向?这里有一份机器人+3D的论文清单
这些论文可以分为以下几个主题:策略学习预训练VLM和LLM表示模拟、数据集和基准这些论文既有arXiv预印本,也有RSS、ICRA、IROS、CORL等机器人学顶会以及CVPR、ICLR、ICML等计算机视觉、机器学习领域的顶会论文,含金量非常高。每部分的论文列表如下:1、策略学习2、预训练3、VLM和LLM4、...
市政府关于表彰常州市第十三次自然科学优秀科技论文的决定
15、新型小型非开挖市政道路施工钻孔机器人方案设计刘海兰、李小平、芮延年(常州信息职业技术学院)16、基于LS-SVM的光伏最大功率跟踪控制方法蔡纪鹤、孙玉坤、李蓓(常州工学院)17、DevelopmentofPassiveMillimeterWaveImagingforConcealedWeaponDetectionIndoors时翔、杨明辉(常州工学院)18、基于自适应...
斯坦福大学AI科学家李飞飞携手Franka机器人创业“空间智能”方向
以倒茶这个动作为例,机器人会先用摄像头确定茶杯茶壶等的位置、形状等要素,再识别出关键点,比如茶杯的中心点和把手的中心点,ReKep会给机器人编写出一系列规则,告诉它要用什么角度、怎么拿怎么倾倒、用多大力气等,机器人只要按照规则行动就能成功倒茶了。这些丝滑动作正是先进Franka机器人力控技术+精妙框架...
3D 视觉派:斯坦福具身智能人物关系图
卢策吾认为,解决机器人首先要深度理解每个物体之间的关系、以及物体是如何被操作的,所以他首先做了一篇视觉关系检测的工作;朱玉可发表了大规模图片语义理解数据集VisualGenome。如今这两篇工作都成为了从视觉研究机器人的经典论文,引用量均超过一千。完成这个工作后,卢策吾就迁到了Leonidas组,与苏昊、祁芮中台一块...
波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而...
普通的非科学家,比如说,非工程师,他们对人形机器人很感兴趣,而狗惹恼机器人却得不到同样的赞誉。熊友军:我是从读博士的时候,2000年开始做机器人的研发,当时读博士的时候,那时候更多的是做工业领域、特种领域的一些机器人,用在一些危险的环境里面,因为那时候机器人技术还是非常不成熟,但在很多特种领域和...
90后北大博导造人形机器人,不学特斯拉
总体看,大模型现在是辅助,但大模型和小模型结合,有可能通向通用机器人(www.e993.com)2024年9月20日。《晚点》:银河的路线就是三维视觉小模型+基础大模型,怎么理解?王鹤:就像我们人有系统一、系统二,有快思考、有慢思考,前者是小脑的能力,在机器人里就是交互控制、灵巧操作等技能,这可以靠小模型处理;后者是大脑的能力,就是认知、理解...
Sora:大型视觉模型的背景、技术、局限性和机遇综述 【官方论文】
4.5机器人技术5讨论5.1局限性5.2机遇6结论A相关工作1引言自从2022年11月ChatGPT发布以来,人工智能技术的出现标志着一个重大的转变,重塑了交互方式,并深入融入日常生活和行业的各个方面[1,2]。基于这一势头,OpenAI在2024年2月发布了Sora,一个文本到视频的生成式AI模型,能...
人形机器人有哪些感知与控制的共性技术?
一、视觉感知技术视觉感知是机器人系统的重要组成部分,在复杂的三维工业场景中利用视觉传感器获取周围环境的真实空间信息,并进行预处理、配准融合以及空间场景表面生成等过程,实现对外界环境真实的刻画及数字模型的重建,为机器人在工业制造中提供丰富的二维和三维信息。目前一般有:双目三维环境感知、3D点云配准、位姿估计...
该怎么让机器人吃下大模型?丨GAIR live
这意味着,机器人可以在更短的时间内学习新技能,更快地适应新任务,甚至能够在没有明确编程的情况下自主解决问题。不仅如此,在大模型的助力下,机器人的感知能力变得更加精准,这无疑将极大地拓展其应用领域,并增强其在复杂环境中的适应性和灵活性。然而,大模型技术的发展同样带来了挑战。如何确保机器人的决策过程透明...
329篇图像、视频生成论文,今年CVPR最火的研究主题是这些
底层视觉(Low-levelvision)一共131篇。传统的识别检测、分割等基础任务论文数量相对减少,但仍是研究重点。值得一提的是,一些研究也在探索新型视觉传感器出现后,与之相适应的新视觉数据处理和建模方法。正如接收论文“StateSpaceModelsforEventCameras”讨论的,事件相机等技术的发展表明,机器人感知周围...