豆包大模型家族全面升级,重磅发布视觉理解模型
2024-12-18 13:53:54 - 第一财经
火山引擎除了推出视觉理解模型之外,还发布、升级了多个其他模型。
12月18日,2024火山引擎FORCE原动力大会·冬火山引擎带来豆包大模型家族全新升级。
在大会上,豆包发布了视觉理解模型,具备更强的内容识别、理解和推理、视觉描述等能力。
据介绍,豆包·视觉理解的输入价格为每千tokens0.003元,比行业平均价格降低85%,相当于一块钱可以处理284张720P的图片,视觉理解模型正式走进厘时代。同时火山引擎还将提供更高的初始流量,RPM达到了15,000次,TPM达到120万,让企业和开发者用好视觉理解模型,找到更多创新场景。
火山引擎总裁谭待表示,视觉理解能力将极大拓展大模型的场景边界,为大模型的场景使用打开天花板,在金融、医疗、建筑、地理、体育、物流等诸多行业还有非常广阔的应用前景。
在本次大会中,火山引擎除了推出视觉理解模型之外,还发布、升级了多个其他模型。大模型家族成员更丰富,大模型能力再提升。其中豆包通用模型pro完成新版本迭代,综合任务处理能力较5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代码上提升58%,在数学上提升43%,在专业知识领域能力提升54%。
此外,豆包·视频生成模型将在2025年1月正式对外开放服务,用户可在火山引擎官网预约正式服务。
数据显示,豆包大模型12月日均tokens使用量超过4万亿,较5月发布时期增长超过33倍。