字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
给定一系列神经网络模块,我们可以将它们顺序排列或并行排列。作者认为,超连接可以学习如何将这些层重新排列,形成顺序和并行配置的混合。在不失一般性的情况下,可以将扩展率设置为n=2。如果超连接以如下矩阵形式学习,神经网络将被顺序排列:在这种情况下,深度连接退化为残差连接,如图(a)所示。当奇数层和偶数层...
字节旗下大模型AI助手豆包推出视频生成内测
字节跳动旗下大模型AI助手豆包正式推出视频生成内测,意味着继快手、商汤、Minimax等公司后,字节跳动正式杀入AI视频生成领域。豆包官网称,豆包视频生成,支持图片文字一键成片,“能将信息转化为生动逼真的视频内容。支持酷炫的动态和运镜,多镜头保持一致,风格比例随意挑选。”(科创板日报)海量资讯、精准解读,尽在新浪财...
字节耳机放了一个哑炮
公司大部分员工进入了字节探索AI的新部门“Flow”。9月,字节跳动完成对Oladance的完全收购。拿下了Oladance的同时,字节也在招兵买马,并显著加快了在AI硬件领域的布局节奏。10月底,阿里巴巴通义千问大模型技术负责人周畅加入字节。早两个月,前面壁智能核心成员秦禹嘉、前零一万物核心成员黄文灏,也先后加入了字节的...
张艺谋为《三体》电影成立AI小组/字节回应大模型训练遭实习生...
除了编辑图片,这个工具还将允许用户根据图片的标题对图片中的对象进行重新着色和细节调整。在Midjourney官方Discord服务器上的一篇文章中,Holz表示,升级版的图片工具将首先对部分用户开放,并将增加人工审核以及「新的、更高级的AI审核员」,以防止功能滥用。「老实说,我们不确定如何精确限制这个功能的部署,」...
表情管理这门课不用学了?字节跳动新技术,上传一张图让情绪瞬间...
现在基于X-Portrait2可以直接将动漫人物的表情"复制"下来,"粘贴"到其他人物上。我上传了一段《美女与野兽》中"野兽"的一段视频,视频中"野兽"的五官与人类类似,还伴随着大吼的动作。这段表演被准确复制到了我用AI生成的图片上,X-Portrait2在表情识别方面没有受到干扰,眼睛、...
字节跳动的图虫往事
张楠在2013年进入字节前,手中的创业项目是看图应用“图吧”(www.e993.com)2024年11月12日。她认为靠时间先后分发图片效率低,正尝试通过照片识别技术,将抓取到的同类图片放在一个“吧”里,让用户刷个不停。加入字节后,她带着抖音赶超快手,今年又跳去剪映,想在AI大潮中“极致地试一次”。
深度|一年之后: AI 大模型航海我们身在何处?将驶向何方?
Suno及字节Seed-Music等在音乐创作场景也进步明显,已经开始在生产端部分使用c)图片Midjourney等头部公司的生图效果已经非常优秀,Flux生态更是将效果提升到新的台阶,且成本持续下降各类编辑工具“此起彼伏”,但多为“脉冲式流量”;本质原因是产品仍停留在“滤镜”定位,需要采用Remini式多效果多滤镜模式组合才能保持...
...神重磅更新Flux版ic-light模型;字节跳动PersonaTalk让AI精准配音
3、告别配音演员?字节跳动PersonaTalk让AI精准配音,连表情细节都完美还原!字节跳动最新开发的PersonaTalkAI模型实现了视频精准配音,声音与嘴型完美同步,保留人物原有特点,让视频更真实自然。该模型采用注意力机制的两阶段框架,具有高度个性化的配音效果和优秀的视觉质量。然而,在处理非人类化身和大幅度面部姿势时仍有局...
字节豆包发布电脑版,PC成了大模型的战略高地?
豆包电脑版整体布局和浏览器类似,“首页”是我们非常熟悉的对话式交流页面,在输入框附近还提供了很多工具,像是帮我写作、图像生成等,点击即可使用。问问豆包或AI搜索则摆放在第二栏,我们可以像使用传统浏览器一样直接搜索或输入网址,上手难度极低。假如把豆包电脑版当作浏览器使用,打开网页时会提供“原网页”和“AI...
攻破AI视频大模型训练挑战!火山引擎送上“神助攻”,方案已应用于...
在模块算法层面,火山引擎此次开源对外输出了超分、降噪、大模型文生图算法能力,选取的模型是开源的,将在一些抖音实际落地的工程优化方案应用到模型加速中。火山引擎也同步开源了基于GPU加速的7种常用基础图像算子能力,并充分扩充了客户端的一些异构能力,包括DSP、NPU、端侧GPU。