追问daily | 首个人类认知基础模型发布?人类如何分辨AI生成的内容...
来自伦敦大学学院神经学研究所的KarlJ.Friston团队提出,通过主动推理与学习,可将贝叶斯模型选择用于自动优化生成模型的结构,从而实现模型的自动发现与学习。研究基于贝叶斯模型选择,通过预期自由能(ExpectedFreeEnergy)框架,将结构学习视为对模型证据的最大化优化过程。具体而言,该方法利用变分自由能构建生成模型,...
...美好的事物需要更多思考和时间来成就、将出现思考数年的模型
O1系列模型主打推理能力:O1与之前的模型(如GPT-4)相比,最大的区别在于它是推理模型,会在回答问题之前进行更多思考,从而提供更优质的答案。O1系列包含两个模型:O1Preview是O1的预览版,O1Mini是体量更小、速度更快的模型,但采用了与O1相似的训练框架。O1模型的研发灵感来自于AlphaGo:OpenAI...
揭秘OpenAI新模型核心技术:打败围棋冠军的AlphaGo用过,华人科学家...
“模型花在思考上的时间越多,处理复杂推理的能力就越好。这使得我们不再受预训练范式的限制,可以通过推理计算进行扩展,为功能和对齐开辟新的可能性。”OpenAICTOMiraMurati表示。同时,她认为,思维链通过使模型的推理透明并使它能够主动推理安全规则,从而使其在意外或新情况中更具弹性,为AI安全和对齐研究的进步...
基于《教父》小说角色,科学家探索GPT-4决策能力,提升大模型个性化...
基于这些数据,大模型能为用户建模一个数字分身或语言模型助手,从而代替人类去执行各种下游任务,例如为用户打造一个推荐系统。这种推荐系统具备冷启动、强推理的特点,不需要用户刷很久的App,才能拥有“很懂你”的推荐系统,而是直接通过用户的语言模型分身就能完成个性化推荐。而在下一步,研究人员将把目光转向真人决策...
分不清9.11和9.9大小,暴露大模型逻辑推理能力短板|快评
逻辑推理被认为是当前大模型最难攻克的一道关卡。而除了逻辑推理之外,对有限的碎片信息进行不断重组、搜寻以找到信息全貌等,类似于传统侦探推理小说所呈现的“碎片信息拼凑分析”,也在大模型当前的能力范围之外。逻辑推理对于大模型的未来发展为什么重要?从应用场景上看,推理能力意味着可靠性和适配性的问题。目前,大...
《麻省理工科技评论》万字长文:什么是人工智能?
多年来,Marcus一直在指出深度学习的缺陷和局限性,正是这项技术将人工智能推向主流,支撑着从大型语言模型到图像识别,再到自动驾驶汽车的一切应用(www.e993.com)2024年11月3日。他在2001年出版的《代数思维》一书中提出,作为深度学习基础的神经网络本身无法独立进行推理。(我们暂时略过这一点,但稍后我会回来探讨像“推理”这样的词汇在一个...
长上下文能力只是吹牛?GPT-4o正确率仅55.8%,开源模型不如瞎蒙
如果按照小说类型划分,所有六个闭源模型在历史小说上的准确率为56.4%,当代小说为46.8%,推理小说为38.8%。对于每个模型来说,都是历史小说的准确度最高,当代小说次之,推理小说的准确度最低。从这个结果来看,貌似LLM的推理更多依赖于自身参数中的知识。接下来做个对比实验:如果某个主张可以通过书中的一小...
两分钟“熟读”《国史大纲》,大模型下一个爆点是“书童”?
Claude200K的大模型,每次可以处理10万个汉字,需要8次才能读完;GLM-4-Long实测可以处理150-200万字,一次就能读完一本《红楼梦》。不过,文本长度只是一个入门能力,能否扮演起“读书助理”的角色,必须要确保能够从大量文本中准确检索信息,特别是当某些关键信息被置于文档的深处时,以及出色的推理和内容生成能力。
人工智能往事:大模型的理论基础,曾一度被判死刑
人工智能需要模拟大脑而非追求严密的推导功能,即对推理的严格约束进行松绑。”看来人工智能要实现破局,需要我们拥有一种完全不同的思维方式。命途多舛的联结主义如果说符号主义试图模拟人类的心智,那么联结主义则试图模拟人类的大脑。与称霸主流的符号主义相比,联结主义的发展更加一波三折,甚至有点像武侠小说的情节...
长长长长长长!世界上首个支持 1 亿上下文的模型正式发布
今天凌晨,AI初创公司Magic发布了世界上第一个支持100M上下文窗口的模型LTM-2-mini。这是什么概念呢,简单来说,该模型能够处理并理解相当于约750本小说的文本量,亦或者1000万行代码。与其他模型相比,LTM-2-mini在处理这些tokens时更加高效。比如,当处理同样多的tokens时,它的算法比Llama...