中国AI大模型测评报告:公众及传媒行业大模型使用与满足研究
针对大模型传媒方向能力的测评选取了较为知名的9款大模型应用程序(或其网页版),分别考察了这些程序的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力,旨在评估不同大模型助手针对媒体行业实际工作场景的能力表现,并最终形成排名。第三章为针对公众的大模型使用与满足问卷调查,共...
中国AI大模型测评报告:公众及传媒行业大模型使用与满足研究_腾讯...
针对大模型传媒方向能力的测评选取了较为知名的9款大模型应用程序(或其网页版),分别考察了这些程序的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力,旨在评估不同大模型助手针对媒体行业实际工作场景的能力表现,并最终形成排名。第三章为针对公众的大模型使用与满足问卷调查,共...
中国AI大模型测评报告:公众及传媒行业大模型使用与满足研究_腾讯...
针对大模型传媒方向能力的测评选取了较为知名的9款大模型应用程序(或其网页版),分别考察了这些程序的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力,旨在评估不同大模型助手针对媒体行业实际工作场景的能力表现,并最终形成排名。第三章为针对公众的大模型使用与满足问卷调查,共...
追问daily | 大脑存储信息的能力比以往估计的高出十倍;新模型表明...
研究发现,基因变异可以通过“上游”调控区域(upstreamregulatoryregions)来增加或减少基因的表达,这有助于解释这些变异在大脑中的作用。通过构建细胞类型特异的基因调控网络和细胞间通信网络,研究团队使用机器学习模型来预测个体是否患有脑部疾病,并识别出潜在的药物靶点。研究表明,基因在不同个体和细胞类型间的变异模式...
从考公、写周报到下厨指南,晚点评测 18 个大模型
第二步,我们让大模型把招股书的部分章节翻译成中文,有文档处理功能的14个大模型中,除了阿里通义千问、腾讯混元和阶跃星辰跃问没回答(不稳定),其他模型都给出回应,不过没一个能完整翻译出来——尽管它们号称可以处理数十万字的文本。还有模型选择“偷懒”,比如MistralLarge只翻译第一句话、百度文心一言只...
所罗门诺夫:大语言模型的先知
用大语言模型的话来说,压缩时间是训练时间;柯尔莫哥洛夫复杂度是大模型的参数量;逻辑深度对应于大模型的最短“推理”(inference)时间(www.e993.com)2024年11月25日。顺便说,大模型术语中“推理”(inference)更合适的译法应该是“推断”,推断是统计意义上的,有别于逻辑意义的“推理”(reasoning)。汉语里“推理”常常指后者。况且,大模型中也有...
2023年度观察:大模型应用加速落地,谁能问鼎年度最佳?
于是乎,如同一列高速疾驰的火车,2023年下半年,大模型迅速驶入了一个新阶段——从技术走向商业化,办公类的MicrosoftPilot,社交类的CallAnnie,无数大模型落地应用迅速站上了互联网的风口。而在诸多落地应用中,最引人瞩目的其实是教育行业。作为社会最核心的公共职能之一,教育一直以来都扮演着引导社会前进的关键...
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
日前(6月19日),牛津大学团队在《自然》(Nature)杂志发表了一篇论文,提出了一种新的分析和计算方法,为解决大语言模型“幻觉”问题,打开了新思路。图源:《自然》(Nature)官网,中文翻译来自浏览器插件“沉浸式翻译”团队提出了一种基于统计学的熵估计方法,称为“语义熵”,来检测大语言模型中的“编造”(confab...
Sora很强大,但也不必过度神话
Transformer模型本质是一个编码器-解码器,输入原始语言,生成目标语言。扩散模型的原理是先给数据添加高斯噪声,再反向去除,从中恢复数据本貌。简单粗暴地理解Sora的原理,就是翻译器+搜索引擎+概率制作(内容)。首先,拿到提示词后,Sora先分析文本,提取关键字,比如主题、动作、地点、时间和情绪,再从它的数据集里搜索与...
是什么让他成为现代计算机之父?丨纪念冯·诺伊曼诞辰120周年(下)|...
翻译|圆圆理论物理范·霍夫(LéonVanHove)教授在《冯·诺伊曼对量子理论的贡献》(VonNeumann'scontributionstoquantumtheory)描述了他在理论物理方面的工作。在之前提到的美国国家科学院的调查问卷中,冯·诺伊曼选择了量子理论的数学基础和遍历定理作为他最重要的科学贡献(以及前文讨论的算子理论)。这种...