WAIC2024|腾讯蒋杰:场景应用会成为未来大模型的决胜要素

2024-07-05 17:02:44 - 环球网

来源:环球网

【环球网科技报道记者李文瑶】7月5日,在2024世界人工智能大会腾讯论坛上,腾讯集团副总裁蒋杰表示,未来通用模型会成为水、电、网络等基础设施一样存在,供业务和应用按需接入。

蒋杰表示,从行业和应用的角度来看,未来会出现更多不同尺寸、不同模态的模型,业务可以通过大小模型的协同,在提升性能的同时满足定制化需求。

WAIC2024|腾讯蒋杰:场景应用会成为未来大模型的决胜要素

腾讯集团副总裁蒋杰

自2023年9月首次亮相以来,经过多次迭代升级,腾讯混元大模型在国内率先采用MoE架构,实现性能大幅提升,模型整体参数量已达到万亿,tokens数量超过7万亿,居国内大模型第一梯队。目前,腾讯混元大模型已通过腾讯云向企业及个人开发者开放,包含万亿、千亿、百亿等不同参数尺寸,接下来,多种尺寸的腾讯混元MoE模型也将对外开源,可分别支持手机端、PC端、云以及数据中心等多样化的部署场景。

蒋杰表示,大模型行业正经历从单模态到多模态,再到全模态的演进。比如在文生图领域,最近效果比较好的是采用DiT架构的模型,它融合了早前主要用于文本生成的Transformer架构,并在图像和视频生成任务中展现出了显著的优势;在文生视频领域,视频生成正朝着更高分辨率、更长时长、更精细的方向发展,一些较好的模型已经能够生成长达数分钟高清的视频,带来了广阔的应用想象空间。

腾讯混元大模型正在积极部署多模态甚至全模态技术,在文生图方面,混元文生图打造了业界首个中文原生DiT架构生图模型效果超开源StableDiffusion模型,发布一个多月Github点赞数超过两千,是社区内最受欢迎的国产开源文生图模型;在3D生成方面,单图输入仅需30秒即可生成动漫、汽车、建筑等类型的3D模型;在视频生成方面,腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频4大核心能力,支持视频风格化、视频重绘等多样化的产品玩法。

现场,蒋杰提到,场景应用会成为未来大模型的决胜要素。当前大模型的落地主要集中在生产工具和提效方面,距离真正的业务创新还有一定距离,缺少杀手级的应用,不过行业的探索一直没有停下。

今日热搜