追问weekly | 过去一周,脑科学领域有哪些新发现?Vol.39
研究团队设计了一套新颖的基准任务,测试7种最新LLMs在语言理解方面的表现。这些任务使用高频语言结构,简化了语言复杂度。每个问题重复测试多次,采用两种回答模式(单词限制模式和开放长度模式),并以400名人类受试者为基线进行对比。基于26,680个数据点的分析表明,LLMs的准确率仅达到随机水平,其回答在一致性方面表现波动。
ChatGPT已经通过“图灵测试”?科学家称该人工智能有人类的智力
今年2月,斯坦福大学的研究人员发现ChatGPT可以通过一个版本的图灵测试,即AI回答一个广泛使用的人格测试。尽管那些研究人员发现ChatGPT-4的结果与人类无异,但这篇最新的论文是AI首次通过基于对话的强大双人图灵测试之一。不过,研究人员也承认,图灵测试有长期存在并且有效的批评。研究人员指出,“风格和社会情感因素在...
为什么智商高的人也会犯错?
在现实生活中,巴雷特等人的研究也正在逐步渗透到情绪智能测评和情绪管理工具的开发中。在批判刘易斯·特曼等人对“一般智力”的痴迷时,罗伯森引用了心理学家詹姆斯·弗林的说法:智商在20世纪的兴起成为我们“认知的历史”,它呈现了我们的头脑被周遭社会塑造的种种方式。然而,罗伯森所倡导的思维方式似乎也正在贡献于一...
一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企...
当让智能体在测试时能够搜索信息时,即为基础xLAM-v0.1-r模型应用MCTS时,成功率从28.6%提升到了48.4%,接近平均人类表现的50.0%,并且显著超过了仅通过结果监督训练的零样本DPO模型的性能。研究者进一步根据下图中概述的算法对基础模型进行了微调,结果比基础DPO模型提高了0.9%。在精心训练的Agen...
世界最聪明女童:2岁时智商测试成绩是同龄人前1%!
而伊斯拉是在斯坦福·比奈智力测验量表(Stanford-BinetIntelligenceScales)中获得同龄人中前1%的智力成绩后加入该组织的。伊斯拉的父母从把她带回家的那一刻起,就注意到她的注意力非常集中。伊斯拉的父亲杰森·麦克纳布(JasonMcNabb)说:“在伊斯拉七个月大的时候,只要有人向她提起一个物品,她就能从图画书中指...
黄仁勋斯坦福分享第二弹:5年实现AGI,10年算力提高100万倍,对手...
不到一周,黄仁勋再度亮相斯坦福,在斯坦福经济政策研究所(SIEPR)经济峰会上接受了访问(www.e993.com)2024年11月25日。本次访问信息量巨大,黄仁勋就加速计算的本质、模型训练的未来、推理芯片的竞争等话题发表了自己的看法,另外,他还对通用人工智能(AGI)何时实现,AI增长需要多少额外芯片产能进行了预测。黄仁勋认为,AI会在五年内通过人类测试,AGI...
斯坦福实验:“表扬孩子”与“鼓励孩子”差别巨大
斯坦福大学著名发展心理学家卡罗尔·德韦克在过去的10年里,和她的团队都在研究“表扬对孩子的影响”。他们对纽约20所学校,400名五年级学生做了长期的研究,这项研究结果令学术界震惊。在实验中,他们让孩子们独立完成一系列智力拼图任务。首先,研究人员每次只从教室里叫出一个孩子,进行第一轮智商测试。
心理学研究发现:高智商儿童小时候有2个共同点,但都与遗传无关
在该研究中,推孟对比奈-西蒙智力量表进行了修订和标准化,提高了智力测验的可信度,形成了世界上第一个广泛使用的智力测试工具,斯坦福-比奈智力量表,为现行的韦氏智力测试提供了重要的参考和借鉴。高智商儿童的共同点在几十年的研究过程中,推孟发现,高智商儿童在小时候都有一些共同点,而这些共同点并非由遗传决定的...
世界最聪明女童:2岁时智商测试成绩是同龄人前1%!
而伊斯拉是在斯坦福·比奈智力测验量表(Stanford-BinetIntelligenceScales)中获得同龄人中前1%的智力成绩后加入该组织的。伊斯拉的父母从把她带回家的那一刻起,就注意到她的注意力非常集中。伊斯拉的父亲杰森·麦克纳布(JasonMcNabb)说:“在伊斯拉七个月大的时候,只要有人向她提起一个物品,她就能从图画书中指...
黄仁勋最新2万字对话全文:未来10年算力将再提高100万倍
黄仁勋强调,未来五年内,AGI将通过人类测试。包括律师考试、胃肠病学等专业测试中,AGI都可以发挥关键作用。不过他也承认,AGI可能还很遥远,因为目前专家们对于描述人类思维如何运作方面仍然存在分歧。谈及AI算力,黄仁勋强调,在未来的10年里,英伟达将会把深度学习的计算能力再提高100万倍,从而让AI计算机不断训练、推理、...