出走的字节高管,谁能造出“中国版Sora”

2024-02-29 20:42:00 - 界面新闻

文|蓝洞商业赵卫卫

如果要给当下国内AI创业的弄潮儿打标签,一个是「清华系」,另外一个则是「字节系」。

「清华系」顾名思义,就是清华大学毕业生。远到百川智能创始人王小川、光年之外创始人王慧文(已被美团收购),近到不久前完成超10亿美元融资的月之暗面创始人杨植麟、张宇韬……对于投资人们来说,创业团队来自清华,是一个最直接的加分项。

逻辑也很简单,毕竟投资先投人。OpenAI大模型GPT-4的华人研发团队中不少人毕业自清华,清华的自然语言处理实验室等人工智能研究水平属于国内顶尖,那么在国内市场同样押注清华团队,错的概率就会降低。

同理,「字节系」成为投资人追捧的AI创业标签也大抵如此。谷歌早就是美国AI人才的黄埔军校,OpenAI300多人团队中有近60人都是谷歌的前员工,占比远高于Meta的前员工,那么,国内互联网大厂中谁能像谷歌一样储备如此多的算法技术人才?

答案就是——全球范围内增长速度快于谷歌的字节跳动。

出走的字节高管,谁能造出“中国版Sora”

抖音前音乐业务总监朱洁创立了VegaX,主打方向是新技术变革下的AImusic,重点是如何继续服务好新作品,推动分发;字节跳动前AILab总监王长虎创办了爱诗科技,打造了视频生成工具PixVerse,国际版已经正式运营了四个月;今日头条前用户产品负责人张前川,加盟了去年估值超12亿美元的创业公司Minimax,负责星野App;抖音前产品负责人Seven(王京津),加入清华系AI创业公司深言科技……

「字节系」的创业者们在寻找适合自己的AI场景,或是创业、或是加入新公司,而字节跳动本身也在追赶OpenAI的速度,对人才的渴求依旧。

人的变动永远先于业务的变化,各家大厂莫不如此。

不光是抖音集团CEO张楠辞任,亲自下场主导剪映押注生成式AI;TikTok还从谷歌挖来了VideoPoet的项目研究负责人、高级科学家蒋路,负责视频生成AI的开发;字节AILab(人工智能实验室)也迎来了阿里M6大模型的前带头人杨红霞,主导语言生成大模型的研发。

而站在当下,OpenAI发布视频生成大模型Sora之后,国内AI创业团队和大厂们更加焦虑了:既然人无法与趋势为敌,那么这场变革的浪潮中,谁才能抓住为数不多的船票?

“字节系”出走创业

「陆育是明星创业者,应该有很多投资人在追。」一位知情人士透露。

2022年7月,阳陆育从字节跳动离职。作为一个连续创业者,他最知名的标签就是Musical.ly创始人之一,Musical.ly曾在2015年成为美国最大的短视频社交平台,两年后被字节跳动以10亿美金收购,产品改名为TikTok,后来成为全球最大的短视频平台。

在Musical.ly被收购后,阳陆育进入字节跳动成为大力智能创始人,推出了大力智能学习灯。但是,随着2021年「双减」政策的落地,字节跳动的智能教育硬件业务也随之边缘化,阳陆育转岗到战略部门,一年之后离开字节跳动开始创业。

没有被抖音收购之前,阳陆育曾认为,「娱乐的全球化和移动互联网的低龄化」是当时创业中最大的两个机会。如今,OpenAI带动了AI赛道风起云涌,阳陆育再次投身其中,回到上海成立了远光灯数字科技有限公司。

招聘信息显示,2023年远光灯数字科技的团队规模不到100人,主要业务是开发一款AI原生产品,面向海外市场的toC应用。

其公司介绍为,「从娱乐及社交场景切入,基于自建的垂直模型构建一个多Agents系统,打造下一代个性化娱乐和服务平台。技术栈涉及:大语言模型,文生图模型,语音模型,Agents,LangChain,推荐系统等。」

「创业项目还处在保密阶段」,知情人士透露,阳陆育团队的这款AI原生产品或许就与AIGC游戏相关,追寻最初的梦想,「娱乐的全球化」或许再次成为阳陆育投身AI创业的机会所在。

与阳陆育回到创业起点一样,抖音前音乐负责人朱洁也在AI大潮之下,开启了在音乐赛道上的创业,他们都回到了泛娱乐的落地场景中,再次成为殊途同归的同路人。

2019年,朱洁从字节跳动离职。在那个抖音神曲满天飞的年代,音乐平台的爆款歌曲往往都是在从抖音上走红开始。朱洁在抖音期间打造了抖音看见音乐计划、中国新唱将等多个项目,促成独立音乐人与抖音合作,扶持中国原创音乐力量的发展。

离开字节跳动之后,朱洁在2020年成立了奇音妙想科技有限公司,依然在音乐产业赛道中找寻细分的机会。奇音妙想曾推出一款名为「唱鱼」的APP,是一款面向音乐爱好者和音乐创造者的娱乐产品,用户可以玩原创说唱,也可以通过AIGC智能编曲实现原创K歌。

如今的朱洁也在顺应趋势的变化,「她创立了VegaX回到了AImusic,业务重点是如何继续服务好新的音乐作品,推动分发」,知情人士透露,奇音妙想与AI结合的新业务模型也将在今年上半年上线。

而除了阳陆育和朱洁,「字节系」的技术派们也都已经纷纷下场。

字节跳动AILab前总监郭传雄,在2023年成立了比特智路,从人工智能更底层的技术入手,解决基础设施所面临的可扩展性和通信效率问题;字节跳动AILab前总监王长虎也在去年创立了爱诗科技,打造了视频生成工具PixVerse。

不难看出,字节跳动是「字节系」创业者难以抹去的标签。

朱洁依然在延续抖音时期的音乐梦想;阳陆育新公司取名远光灯,跟他在字节跳动做智能灯业务相呼应。即便是创业项目刚刚起步,但AI的世界大门刚刚打开,他们凭借之前的能力,已经找到了属于自己的赛道。

“字节系”变相回流腾讯

除了投身AI创业,「字节系」的另外一个路径就是,加入一个上升期的AI创业公司,相比之下风险更低。

2023年的大模型创业热潮中,估值最高的两家公司就是MiniMax和光年之外,当时美团以2.34亿美元现金+3.67亿元人民币债务+1元钱现金收购光年之外,而另外一边的MiniMax刚刚完成2.5亿美元融资,估值超12亿美元,投资方包括腾讯和米哈游。

到了今年2月,大模型创业公司又有了新高度。

成立不到一年的月之暗面(MoonshotAI)被爆出新一轮融资10亿美元,但很快有消息人士指出,融资额为8亿美元,领投方新股东为阿里和小红书,投后估值约25亿美元,成为与MiniMax、百川智能、智谱AI等同一梯队的大模型独角兽。

月之暗面备受追捧,再次验证了资本对「清华系」的热衷。

月之暗面创始人杨植麟和张宇韬,都是清华大学计算机系毕业,学生时代就跟随老师唐杰开始人工智能方向的研究,发表过多篇顶级论文,而且杨植麟在华为「盘古」大模型等研发上都积累了成功经验。

去年,国外科技媒体《TheInformation》曾盘点中国AI初创企业的Top5,杨植麟以个人名字入选,其他四家分别是MiniMax、澜舟科技、智谱AI、光年之外。如今获得融资,尤其是OpenAI发布Sora后,国内创业公司加快了追赶步伐,月之暗面预计将在今年上半年推出对标GPT-4级别的大模型产品。

明星级别的AI初创企业,自然不会放过对人才的渴求,尤其是「字节系」。

2023年,今日头条前用户产品负责人张前川就加入了大模型独角兽MiniMax,负责旗下AI应用产品星野。MiniMax于2021年12月成立,已有文本、语音、视觉3个模态的自研基础模型。2023年3月,MiniMax推出面向企业用户的API开放平台,支持文本和语音模型的服务调用。

无独有偶,抖音前运营和本地生活负责人王京津(Seven),也在去年加入清华系AI创业公司深言科技。在抖音任职的2021年,王京津负责的运营和本地生活业务,曾被分别分权给抖音市场负责人支颖和直播负责人韩尚佑兼管,如今,王京津成了深言产品负责人。

深言科技作为一家AI创业公司,同样主打自己是「清华系」,背靠清华大学自然语言处理实验室。

但对于「字节系」人才来说,加入一个明星大模型创业公司,未来很可能都离不开腾讯的标签。去年MiniMax的A轮融资,金额超2.5亿美元,背后的投资方就是腾讯集团的腾讯投资,这也被外界认定为腾讯在大模型领域的首笔已知投资,与此同时,深言科技也拿到了腾讯、好未来等机构的数亿元战略投资。

与字节跳动专注研发自己的大模型的业务驱动策略不同,腾讯在大模型领域依然采用广撒网的投资驱动策略,这就意味着「字节系」人才很大程度上会回流到「腾讯系」的AI初创公司中。

当然,AI明星创业公司们对人才的渴望是迫切的,不只是「字节系」,连腾讯自己的人也是一样,人才的流动带动了创业公司与大厂们的业务合作。比如MiniMax如今的副总裁魏伟,曾经就是腾讯云的副总裁,负责开拓国际业务,2022年之后,腾讯云为MiniMax搭建了从资源层、数据层到业务层的云架构。

字节跳动等待“ 90 分”

毫无疑问,在OpenAI发布Sora之后,趋势已定,成为了2024年国内多模态大模型创业者发力的主要方向,而对于字节跳动来说,一方面是昔日的员工纷纷离职投身AI创业,另外一方面则迫切需要优秀人才的加入。

近期,昆仑万维创始人周亚辉在朋友圈表示,一位美国华人AIScientist加入字节北美做TechLeader,随后有媒体挖出这个科研人才就是谷歌VideoPoet的项目研究负责人、高级科学家蒋路。

此外,周亚辉评价说,OpenAI这一路的发展战略是教科书级别的,在这一波AI革命中可以打95分以上。

「不过这波AI中,字节AI战略也就40分吧,还是靠了家底厚,啥大模型矩阵,甚至不如谷歌,谷歌可以打70分。当然一鸣同学天才般的智力和悟性,HandsOn估计不出3月就会从40分变80分甚至90分。」

周亚辉还补充说,他强调的是字节过去一年半的AI战略,不是字节的战略。「跟OpenAI90分的差距在哪里?缺乏更细节的颗粒度,比如下一代的信息平台是什么形态?新的时代信息入口、内容入口、Messenger入口会不会三合一或二合一?(任何一个情况发生都是台阶式成长。)」

此番评价引发热议,周亚辉还剧透说,OpenAI即将发布GPT-4.5,并且可能故意会在Anthropic(OpenAI的前成员创立)发布的Claude3的时间。

国内大模型发展水平,与OpenAI的差距有目共睹,字节跳动的AI战略能够达到90分,在今年追赶上OpenAI吗?这可能是包括周亚辉在内的许多行业人士的共同期待。

相比腾讯、阿里等大厂纷纷在投资大模型创业公司,字节跳动仍旧聚焦在自身大模型业务本身,推出过多款AI对话功能的产品,诸如豆包和Cici、人工智能助理工具ChitChop及AI聊天机器人和应用程序编辑开发平台Coze等,而最令外界期待的,莫过于抖音CEO张楠辞职后亲自督战的剪映,剪映可能成为国内市场最先爆发的AI应用产品。

Sora引爆文生视频赛道之后,国内大模型厂商的焦虑尽显,字节跳动首当其冲。

字节跳动曾辟谣,旗下Boximator目前还无法作为完善的产品落地,距离国外领先的视频生成模型还有很大差距。但随后,字节跳动发布了文生图模型SDXL-Lightning,但在文生视频赛道,依然有很长的一段路要追赶,因为逻辑很简单,文生视频的视觉数据模型,必然会是在大语言模型的基础上发展而来,大语言模型的底子不结实,不可能有令人眼前一亮的多模态模型产品。

对于2024年的大模型行业来说,一大期待可能就是,字节跳动自身和字节系的创业者们,谁会先拿出爆款应用产品?在逐渐分化的阵营中,谁又会在超级应用里占据一个前排位置?

今日热搜