百度智能汽车事业部王博:下一代语音模型的发展方向是从交互式变成对话式

2023-06-09 10:37:47 - 睿见Economy

2023中国汽车重庆论坛于6月8日-9日召开,百度智能汽车事业部智舱业务部和交付中心总经理王博出席并发表演讲。

百度智能汽车事业部王博:下一代语音模型的发展方向是从交互式变成对话式

王博表示,早在10多年前,语音就作为智能座舱的一个交互方式首先出现了,但是当时的语音主要是一个智能摇控器,它并不是特别的好用,因为基本上它是一个非常城市化,而且只支持限定语音的摇控器。随着机器学习深入突破,尤其在2018年以后一直到现在各个场景、各个领域、整个座舱上、整个交互方式越来越流畅、越来越顺畅。但是它基本上是基于指令式的交互。随着大模型技术的出现,这个语音交付会越来越面向对话式的交付,从命令式到对话式是大模型给语音交互带来的一个变化。

王博指出, 下一代语音模型的发展方向,一定是从交互式变成一个对话式,在这个过程中发现两个核心的变化点:一是产品体现上之前命令式的交互方式逐渐变成一个对话式的交互方式,意味着可以更好的理解用户的意图、更好为他们提供服务,同时在技术上也会出现一个很核心的变化,因为当前语音交互的方式更多是通过一系列人工定义的方式实现对语音的理解、实现对意图的解析,随着大模型的出现,将端到端的解决问题,意味着所有用户的需求都可以被更好的理解,并且可以更好通过一系列科技上的交互方式给予磨损。

在王博看来,现在已经到了通过大模型来提升语音智舱语音交互的一个拐点。这些整体革命的完成,是需要有深厚的技术积累。大模型可以重塑两个关系。第一个关系是驾驶员跟座舱的关系。大模型可以帮助智能座舱给用户提供一个拟人的服务。一方面它可以有一系列通过对话式精准理解驾驶员的诉求,帮助驾驶员完成力所能及的一些工作,同时他可以在堵车的时候,类似这种场景下作为一个情绪疏导员,这种场景有非常多的畅想空间,并且我们现在已经在实验室完成了一系列的验证,已经具备了量产的能力。同时品牌和车主之间的关系也有可能基于大模型进行重塑。据统计,中国有4.6亿的驾驶员,车企是不可能为这么多人提供非常千人千面服务的,大模型可以解决这个问题,可以拉进车企和用户之间的关系,并且及时了解他们的诉求、满足他们的服务。

今日热搜