宇树:人形机器人开启具身智能新纪元

2024-07-09 07:02:10 - 媒体滚动

宇树:人形机器人开启具身智能新纪元

“人形机器人不仅将拥有超越四足机器人的巨大潜力,更是实现具身智能落地的最佳硬件载体。”这是杭州宇树科技有限公司(以下简称宇树)联合创始合伙人陈立的判断。

在科技发展的浪潮中,人形机器人作为智能科技的杰出代表,正逐步从实验室走进我们的生活。近日,《企业家》杂志就人形机器人的研发与应用前景采访了陈立。他不仅分享了宇树在四足机器人领域的开创性成果,更对人形机器人的上限、发展潜力以及面临的挑战提出了独到见解。

宇树:人形机器人开启具身智能新纪元

陈立

杭州宇树科技有限公司联合创始合伙人

01

上限远高于四足机器人

《企业家》:宇树在2023年8月,仅用半年时间发布了全尺寸通用人形机器人UnitreeH1。作为全球四足机器人行业的开创者,您在研发过程中感受最深的是什么?

陈立:回顾整个UnitreeH1的开发过程,我印象最深刻的有三点。第一,这款H1定位于在工业场景中承担“吃苦耐劳”的功能,对各方面要求非常高。因此,要开发一款人形机器人产品,必须对它的可靠性、稳定性更具前瞻性。

第二,我们采用了小步快跑的方式进行迭代。从H11.0学会走路、H12.0学会搬运物体及对地形的适应能力到H13.0奔跑速度达3.3m/s,再到H14.0实现了后空翻动作,这一系列功能的完成不是一蹴而就的,而是逐步递进的。

第三,底层技术积累至关重要。宇树的四足机器人核心零部件如电机、减速器、电机驱动器、编码器、传感器、主控甚至电池都采用自研,将四足机器人的相关技术迁移到人形机器人上,对宇树来说也是理所当然的。虽然人形机器人与四足机器人是完全不同的两个产品,技术上比四足机器人更有难度,但它们之间的底层逻辑是相通的。只有掌握了核心技术,才能在产品上发挥出超乎预期的能量。

《企业家》:人形机器人与四足机器人的区别是什么?从四足到人形,宇树面临的最大挑战是什么?

陈立:从现阶段来看,四足机器人在产品稳定性、可靠性和负载能力等方面展现出了比人形机器人更卓越的性能。但是从潜力来看,人形机器人或许具有更大的优势。由于人形机器人的形态、关节设计等与人类高度相似,它更易于适应和融入人类的生活及工作场景,比如进行烹饪、操作工具(电钻、螺丝刀等),甚至驾驶汽车等复杂任务。

从四足机器人发展到人形机器人,我们面临的最大挑战在于后者需要适应更多样化的环境和任务,无论是家庭服务、工业生产还是公共服务领域,人形机器人都需要展现出高度的灵活性和适应性。这意味着它不仅要具备强大的感知和认知能力,以理解和响应各种复杂场景,还需要拥有卓越的运动控制和操作能力,以执行各种复杂的任务。

与四足机器人相比,人形机器人的复杂性大大增加,需要考虑其可靠性、稳定性、成本、续航能力以及运动控制的复杂性。比如,四足机器人只有12个关节电机(即12个自由度),而宇树最新的G1人形机器人拥有43个自由度,电机数量是四足机器人的3到4倍。

目前,我们的核心业务仍然是以四足机器人为主。但伴随人形机器人的快速发展,它在公司业务中的比重将会逐步增大,甚至有望超过四足机器人。

02

实现具身智能最好的形态

《企业家》:人形机器人是实现具身智能最好的形态吗?

陈立:是的。人形机器人是实现具身智能落地的最佳载体。因为具身智能涉及多种感知和控制,类似于人类的视觉、听觉、嗅觉、触觉以及大脑和小脑的功能等。人形机器人也具有类似的结构,大脑负责认知和感知,小脑负责运动控制,可以完成各种任务和动作。

具身智能还包括手和脚的灵巧操作,以及快速的运动能力。具身智能的训练成果可以直接迁移到人形机器人身上,实现无缝对接。

《企业家》:人形机器人非常依赖AI大模型的发展吗?

陈立:是的。几年前,人工智能的发展被认为已经到达瓶颈。这是因为人工智能的泛化能力不足,无法实现举一反三,只能回答特定问题,无法进行更深入的对话。

然而,随着大模型的出现,人工智能的泛化能力得到了显著提升。例如,使用ChatGPT进行对话时,它能够根据针对性的问题进行有条理的回答,提供了更好的用户体验。这主要得益于AI大模型的强大泛化能力。

宇树:人形机器人开启具身智能新纪元

对于人形机器人来说,面临的任务是多样且复杂的,需要它具备更强的泛化能力。比如,让人形机器人在桌子上摆放西红柿、菜刀和砧板,完成握住菜刀切西红柿等任务,这需要它具备更高的泛化能力才能完成。

AI大模型让人形机器人进入千家万户提供了巨大的可能性。在AI大模型尚未成熟之前,人形机器人的应用可能仅限于工厂中的特定工序,完成一些简单且重复性的工作,这与现有的机械臂并无太大差异。

然而,随着AI大模型的发展,人形机器人的功能和应用范围得到了极大的拓展。它不再局限于简单的工厂工作,而是能够胜任更加复杂、多样化的任务。这是因为AI大模型赋予了它强大的泛化能力和学习能力,使其能够像人类一样处理各种复杂的场景和问题。

《企业家》:既然AI大模型对人形机器人如此重要,宇树是如何布局的?

陈立:目前,宇树H1已经开始使用英伟达的人形机器人通用基础模型,这些大模型提高了人形机器人在仿真环境中的学习效率,也让我们的研发团队能够更快地开发出运动控制模型。

2023年9月,宇树人形机器人团队的几位工程师第一次开发人形机器人运动AI大模型时,表现得相当糟糕,机器人在运动时摇摇晃晃,甚至无法站立。有一天晚上,团队的一位工程师在电脑上对AI大模型进行训练,忘记关机便回家了。第二天回来时,发现训练出来的性能超出了预期。这正是当前人工智能技术为人形机器人带来的惊喜。

尽管AI大模型很重要,但仍存在不足之处和挑战。目前,语言大模型的应用更为广泛,但仅依靠语言大模型是不够的。实际上,对于更智能的人形机器人来说,它还需要具备决策能力,以及如何协调双手或双腿来完成任务,这也是未来需要克服的难点。

AI大模型面临成本和能源效率两方面的挑战。比如,OpenAI在开发如GPT-4模型时,资源消耗大。不仅大量依赖GPU板卡,同时又非常耗电。

03

落地还差什么?

《企业家》:H1的落地应用情况如何?宇树又是如何了解客户的真实需求的?

陈立:我们已经在高校科研院所、能源行业如国家电网、汽车工厂等场景落地。

在具体的场景下有怎样的需求,人形机器人能执行哪些任务,这需要双方共同探索。比如,我们与国网成立了联合攻关实验室,主要探索地下隧道和地下管廊等恶劣环境下,如何引入人形机器人进行定期巡检和维修。

如果不建立这种合作,我们可能不了解这些需求和场景,也不清楚工人在这些环境中面临的问题,以及我们的人形机器人如何完成这些工作。合作的基础是双方互补。

目前在具体需求方面,更多是需求方主动找到我们。例如一些工厂的零部件装配由工人完成,随着劳动力成本的上升,他们想改变,那么人形机器人就非常适合,因此会主动找到我们,我们再进行评估。如果适合使用人形机器人,就会进行现场测试,并与他们的团队共同合作。

为了推动人形机器人产业发展,我认为强强联合非常重要,而且这种合作方式是无边界的,这样不仅效率高,而且相互之间的配合程度也会非常好。

《企业家》:为了加速人形机器人落地,您认为还需要做些什么?

陈立:我认为目前应着重考虑以下两个方面的问题。一方面,我们需要更深入地了解产品的应用。比如,宇树可能对某些行业的需求并不了解,但行业内的专业人士却非常了解。因此,我们需要与他们充分沟通,了解他们的需求和痛点。另一方面,我们需要考虑在实际场景中解决问题的方法。有时候,人形机器人可能无法完成某些工作或者成本过高。这时,我们可以通过工程化手段,在不改变机器人本身的情况下,调整场景或适配工程,以降低成本并提高适用性。

宇树:人形机器人开启具身智能新纪元

《企业家》:随着人形机器人的发展,会衍生出哪些新生态?如何参与这场浪潮?

陈立:例如人形机器人进入家庭充当保姆的角色。对于家政公司来说,未来可能变成提供人形机器人租赁服务的公司。同样,工厂中的工人也会改变。未来更多的人形机器人可能会进入工厂,而劳务市场服务的对象可能就是人形机器人。人形机器人进入工厂并不是取代工人的工作,而是让工人从枯燥的工作中解放出来,转而从事更具技术含量的工作,推动整个社会的进步。

从长期来看,特别是在未来3~5年,对于提供服务类型的业务,本地合作伙伴将发挥关键作用。我们可以输出人形机器人本体,而本地的集成商、代理商或合作伙伴则负责提供本地化的服务,实现共赢。

《企业家》:对于正在创业的人,您有哪些经验和建议?

陈立:作为一名创业者,我在整个创业过程中面临很多选择和诱惑。作为企业的创始人/合伙人,我认为重要的是坚守自己的内心,不被外界诱惑所左右。不能因为某个领域很火就去跟风,而应该坚持自己的方向和未来规划,避免精力分散。

此外,如何带领团队也非常重要。要让团队成员清楚公司的核心价值观、产品理念,共同为公司的发展而努力。

今日热搜