邓志东:端到端已成为人工智能自动驾驶新范式
转自:新华财经
新华财经重庆9月20日电(梁恒维)端到端自动驾驶在汽车行业内热度逐渐提升。清华大学人工智能研究院视觉智能研究中心主任邓志东表示,人工智能自动驾驶可理解为一体化完成的、彻底的端到端自动驾驶解决方案,而非分段赋能进而串联构建的闭环系统。端到端已成为人工智能自动驾驶的新范式。
邓志东是在9月20日于重庆举办的“汽车产业智能化与全球化新趋势研讨会”上作出上述表述的。本次研讨会作为2024中国汽车新质生产力发展论坛系列主题研讨会之一,以“向新而行、向海而兴”为主题,旨在助力汽车产业电动化、智能化、网联化、国际化发展。
总体上看,人工智能赋能汽车产业发展目前还处于分段赋能与串联的阶段,即把整个自动驾驶系统划分为环境感知、自主导航、预测、决策、规控等不同阶段,再分别利用AI进行赋能,然后串接起来构建一个闭环系统。然而,这种分段方式无法解决长期困扰自动驾驶产业落地的长尾感知与边缘决策问题。
端到端自动驾驶解决方案是一种整体化、数据驱动的技术路径,旨在简化自动驾驶系统的架构设计。邓志东介绍,有别于模块化的自动驾驶解决方案,端到端的解决方案模拟与交互学习真实世界中物体之间的运动学、动力学及其他物理学规律,能实现统一的和一体化的表达、理解、推理、预测和交互,是一种“快思维”的直觉技能学习模式,是自动驾驶研发范式的一种重大创新。
通俗来讲,端到端的自动驾驶方案就是将整个智驾系统看作一个整体模块或一个智能体,系统接收到视觉传感器的输入后,直接输出驾驶行为与动作。
邓志东表示,采用端到端的一体化解决方案,基于已有的通用多模态大模型,发展针对具身理解、具身推理与具身动作生成的下游微调训练大模型,用整体一个生成式大型语言模型,大大减少代码量,或将从原来的数十万行减少至不到几千行。相比直接研发从零开始预训练的大模型,这种方案不仅所需预训练数据和AI算力大大减少,而且还可以持续增强智能驾驶的环境适应能力与自主性,持续降低智驾接管率,可望给消费者带来更安全、更人性化、更个性化的用车体验。
如何加速智能网联汽车的产业化落地?邓志东认为,应从构建高质量、大规模、多样化和多模混杂的数据集,结合各种AI增强技术,包括提示增强、检索增强、知识增强和逻辑增强技术等,从模仿学习与自主探索实践入手,带动智能网联汽车行业格局演变。邓志东特别强调,端到端的解决方案需要海量的高质量数据进行下游微调训练和强大算力的支持,在某种意义上数据比模型更为重要。
未来,在生成式人工智能的支撑下,汽车会从单纯的交通工具逐步演化为提供多种服务的移动智能终端和数字空间,朝着智慧化、共享化方向迈进。端对端的自动驾驶方案,将实现对整个驾驶行为的“融会贯通”与智能升级,使整个汽车产业及其生态发生巨大变革。
编辑:董时珊
版权声明:未经新华财经书面授权许可,严禁任何个人或机构以任何形式复制、引用本文内容或观点。