对话MiniMax 闫俊杰:现在的 AI 应用不会成为 Super App,但这不重要
2024年5月23日 - 极客公园
闫俊杰:对,这个会造成延时和信息丢失。这次OpenAI就更进一步,直接把语音模型和语言模型合在一起了。这在技术上是比较容易做的,因为声音和语言模型都是Transformer的模型,本质上就是把声音模型的incoder(编码器),对齐到一个语言模型上去。这个事在图片里面已经发生了,现在只是把图片换成了声音。而且因为声音的...
详情
闫俊杰:对,这个会造成延时和信息丢失。这次OpenAI就更进一步,直接把语音模型和语言模型合在一起了。这在技术上是比较容易做的,因为声音和语言模型都是Transformer的模型,本质上就是把声音模型的incoder(编码器),对齐到一个语言模型上去。这个事在图片里面已经发生了,现在只是把图片换成了声音。而且因为声音的...