一周科技追踪(上)·AI训AI,越训越弱智?
一周科技追踪(上)·AI训AI,越训越弱智?本周动态追踪科技前沿定位核心动态半导体??欧洲半导体行业协会呼吁欧盟加快起草《芯片法案2.0》??阿斯麦CEO:美国限制对华出口更多出于“经济动机”人工智能??大众成为首个标配ChatGPT功能的量产车品牌??美英欧签署全球首份具法律约束力的AI公约??特斯拉计划...
Nature新研究:大模型越大,越爱胡说八道
智东西9月29日消息,国际顶尖科学学术期刊Nature(《自然》)9月25日刊登了一篇有关AI大模型“脑雾”现象的研究。一个来自西班牙的研究团队发现,几个参数量更大、版本更新的AI大模型,误答比例超60%。其研究对象包括美国AI大模型独角兽OpenAI的GPT大模型、美国元宇宙巨头Meta的Llama大模型,以及由美国明星AI创企Hugging...
牛津剑桥“投毒”AI失败9次登Nature封面,引爆学术圈激辩,AI训AI...
最近Nature封面一篇论文引起的风波,让我们明白:重要的并不是「合成数据」,而是「正确使用合成数据」。本周四,牛津、剑桥、帝国理工、多伦多大学等机构的一篇论文登上了Nature封面。不过,让人没想到的是,论文一经刊出便引发了AI社区的大量讨论。一些人认为,问题的核心不在「合成数据」上,而是在「数据质量」上。
Nature封面:AI训AI 越训越傻
Nature封面:AI训AI越训越傻AI训练AI,可能会让AI变傻?!来自牛津、剑桥等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGEOUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个行业浇了一波冷水。
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
用AI生成的数据训练AI,模型会崩溃?牛津、剑桥、帝国理工、多伦多大学等机构的这篇论文,今天登上了Naure封面。如今,LLM已经强势入侵了人类的互联网,极大地改变了在线文本和图像的生态系统。如果网络上的大部分文本都是AI生成的,我们用网络数据训练出的GPT-n,会发生什么?论文地址:httpsnature/...
Nature封面:AI训AI 越训越傻 模型崩溃之谜
Nature封面:AI训AI越训越傻模型崩溃之谜Nature封面:AI训AI越训越傻人工智能大语言模型的智慧通常与其接受的训练数据量成正比,越多的数据往往造就更“聪明”的模型(www.e993.com)2024年10月19日。然而,《自然》杂志最近发布的一项研究揭示了一个反常现象:仅依赖AI自身生成的数据来锻炼这些大模型,不仅不会让它们变得更智能,反而会导致性能...
Nature最新封面:AI训练AI,也许越来越笨?
研究团队认为,用AI生成数据训练一个模型并非不可能,但必须对数据进行严格过滤。首先,在每一代模型的训练数据中,保留一定比例的原始数据,例如10%或20%。这样可以确保模型始终接触到真实世界的样本,避免完全依赖于模型生成的内容。定期对原始数据进行重采样,并将其添加到训练数据中。这样可以保证训练数据始终保持...
用AI 生成的数据训练 AI,AI 会越来越“傻”
AI正在变傻一篇发表于2024年7月24日的《自然》(Nature)杂志上的文章指出,用由AI生成的数据训练AI,随着AI的迭代,可能会让AI濒临“崩溃”。来自牛津大学、剑桥大学、英国帝国理工学院、多伦多大学等高校的研究人员,用先前几个版本的大语言模型(LLM,比如GPT、OPT)生成的数据占多数的网络数据...
AI 训 AI 遭投毒 9 次后大崩溃,牛津剑桥等发现登 Nature 封面
用AI生成的数据训练AI,模型会崩溃?牛津、剑桥、帝国理工、多伦多大学等机构的这篇论文,今天登上了Nature封面。如今,LLM已经强势入侵了人类的互联网,极大地改变了在线文本和图像的生态系统。如果网络上的大部分文本都是AI生成的,我们用网络数据训练出的GPT-n,会发生什么?
Nature 曝惊人内幕:论文被天价卖出喂 AI,作者 0 收入
最近,Nature的一篇文章向我们揭露了这样一个事实:连科研论文,都被薅去训AI了……据悉,很多学术出版商,已经向科技公司授权访问自家的论文,用来训练AI模型。一篇论文从酝酿idea到成稿,包含了多少作者日日夜夜的心血,如今很可能在不知情的情况下,就成为训AI的数据。这合理吗?