国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃星辰的多模理解大模型,这款模型在三个方面优势突出:一是感知能力。创新的图文混排训练方法,让Step-1.5V能理解复杂图表、流程图、准确感知物理空间复杂的几何位置,还能够处理高分辨率和极限长宽比的图像。二是推理能力。根据图像内容...
对标o1,Kimi放出了最能打的国产模型
在多项基准能力测试中,k0-math的数学能力可对标OpenAIo1系列公开发布的两个模型:o1-mini和o1-preview。具体来说,在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型:k0-math模型得分93.8,o1-mini为90分,o1-preview...
【明日主题前瞻】首款国产原生适配大模型车规级大算力芯片发布
光至R1是在北京亦庄支持下诞生的,是首款国产原生适配Transformer大模型的车规级大算力芯片,能为高阶智驾和具身智能等AI应用场景提供强大的算力支持和创新动力。开源证券陈宝健分析指出,高算力芯片是实现自动驾驶的基础,L3、L4、L5级自动驾驶分别需要约20-30TOPS、200-500TOPS、2000以上TOPS的算力支持,英伟达、高通等...
国产大模型生成的视频为何令人震撼?MiniMax创始人说“快就是好”
稀宇科技还更新了语音模型abab-speech-1,它能生成普通话、粤语、日语、韩语、西班牙语等多语种合成语音,拟人度高,情绪变化细腻自然。闫俊杰介绍,目前,MiniMax大模型每天与终端用户进行30亿次交互,每天处理超3万亿token文本,生成2000万张图片和7万小时语音。每天30亿次交互的用户,既来自“海螺AI”“星野”等公司自有...
壁仞科技丁云帆:做好三类工作,国产AI芯片也可用于大模型训练
单卡算力因为各方面的限制,能做的上限是有限的,但单芯片本身在微架构层面还是有创新的空间的:一方面,保证比较好的兼容性,支持多种workload;另一方面,提供比较高的计算效率,在类似于tensorcore上去做优化。此外,单卡单机还是不够,需要千卡集群、万卡集群进一步提升算力,这个时候对于网络和基础设施的要求其实...
国泰君安:看好国产AI大模型落地趋势中的应用场景投资机会
证券时报网讯,国泰君安研报指出,看好国产AI大模型落地趋势中的应用场景投资机会(www.e993.com)2024年11月26日。对后续国产AI的发展保持信心,传媒行业有望受益:1)教育行业有望受益于语音交互和多模态发展,关注:世纪天鸿等;2)情感陪伴赛道同样有发展机会,关注昆仑万维、盛天网络等;3)关注多模态发展对影视制作及营销场景的改造、以及图像语料需求;4)...
实测4款国产头部AI视频大模型:不及预期、差异明显
本次我们选取几个国内头部视频生成模型进行实测,包括可灵、即梦、PixVerse、清影(智谱清言),具体直观地测试不同的模型表现。为尽可能客观地比较测试结果,我们采用如下设定:1.使用统一的中文提示词,包括简易提示词和复合提示词;2.测试包含图生视频和文生视频两种方式;...
姚期智、王坚、李彦宏、徐立高论AGI,百款国产大模型群雄逐“沪”|...
作为一年一度的AI界盛事,本届大会展览面积超5.2万平方米,500余家企业参展,展品超1500项,重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等重点领域,MiniMax、百川智能、智谱AI等公司的数百款大模型集体亮相,集中展示一批“人工智能+”创新应用最新成果,首发一批备受瞩目的创新产品。
免费!国产大模型编程助手豆包MarsCode上线,还有登录即用云端IDE
豆包MarsCode是基于豆包代码模型打造的智能开发工具,在软件开发领域更加得心应手。通过定向优化,豆包MarsCode现在能提供更高质量、更精准的解答,帮助开发者解决各种问题。这不仅意味着豆包MarsCode是一个强大的编程助手,它还能成为你的学习伙伴,在你从编程新手成长为技术大牛的旅程中,提供高效的陪伴和支持。
全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队...
阶跃星辰创始人姜大昕博士表示,模型扩大到万亿级别时,MoE几乎是必选项,这是权衡了性能、参数量、训练成本、推理成本等各个维度后的最佳选择。要训练如此大规模的MoE模型,有两条路可走:一是将已有模型进行向上复用(up-cycle)。这个方案最大的好处,就在于省钱省力,算力需求低、训练效率高,但会限制模型能力的上限,...