送你一碗“海龟汤”
最多只能算是IQ小侦探,因为“海龟汤”的谜面必须可以用“为什么”或“怎么回事”来提问,如果提问类似“甲乙丙丁四个嫌疑人谁才是真凶”“死者是被什么凶器所杀”的,都缺少情境和人物关系,因此构不成“海龟汤”的谜面。
我用2 万条真人 AI 海龟汤游戏数据,评估大模型推理能力哪家强
收集用户在玩AI海龟汤游戏中输入的猜测,逐一进行人工标注(对、错、不相关),然后用这个数据集,测试大模型的评判结果相较于真实结果的准确率。我发现现有评测指标的种种问题在海龟Benchmark上都可以完美避开1.不需要额外背景知识。海龟汤游戏里几乎包含了推理所需的全部信息,一旦得知汤面和汤底,大模型就能作...
春藤夏院探秘海龟汤:故事背后的逻辑推理游戏
通过不断的提问和推理,参与者最终会发现,原来书房里有一架古老的钢琴,它的琴弦由于风吹日晒而松动,每到夜深人静时,琴弦就会自动振动发出声音。而由于宅院荒废多年,声音在空旷的房间里回荡,形成了悠扬的琴声。小伙伴们,海龟汤不仅是一个有趣的推理游戏,更是一个锻炼逻辑思维和创造力的好方法。如果你对海龟汤...
世界读书日:当世界读书日遇见海龟汤·绝不缺席的正义《白银案实录》
世界读书日:当世界读书日遇见海龟汤·绝不缺席的正义《白银案实录》,海龟,强奸罪,杀人罪,白银案实录,世界读书日
AI智能体|海龟汤游戏实践,看你能拿多少分?
随着科技的发展和人们生活节奏的加快,越来越多的人开始寻求在休闲时光中放松身心、锻炼思维能力的娱乐方式,其中有一款很常见,也是很简单的情景推理游戏—-海龟汤。于是我就尝试自己做了一款海龟汤游戏,分别尝试在智谱清言和coze两个平台上建立自己的智能体,其中无论是汤底的生成,还是对提问的判定,都由LLM生成,用户...
OpenAI 全新 o1 模型实战奥数、推理题:AI 水平又上新高度
一是,数学与逻辑能力强,速度还不慢(www.e993.com)2024年11月22日。二是,能够通过模拟人类的思维过程,帮助模型逐步分解复杂问题。这也是OpenAI在官方介绍中提到的思维链(CoT),与人类在回答难题之前会长时间思考类似,o1在尝试解决问题时会使用思维链。比如在回答「海龟汤」问题的时候,会进行推测、预设、分析等。无论是解题思路或者是剧情还原,都...
实测OpenAI新模型o1 :做题王者,实战青铜
海龟汤是一种推理游戏,出题人给出简短、模糊的故事背景,由玩家自己主动提问。出题人只会回答“是”和“不是”,然后玩家根据出题人的回答,结合自己的推导,给出故事的真相。我给了o1-preview五次提问的机会,然后让o1-preview尝试推理真相。每一次提问,o1-preview都考虑了十几秒,层层递进。
优爱腾芒齐聚推综赛道,招商困境“弯道超车”?
除此之外,在“小而美”的微综艺中,来自大芒计划轻综艺同样向推理领域进军。不仅打造了十分钟极速推理节目《YESORNO》,主打桌游“海龟汤”;而且还有全女侦探的《漂亮的推理》,通过简单直接的问答形式,还原离奇故事的真相。这些综艺节目主打轻体量,对头部综艺进行补充,以“十分钟推理”作为核心卖点,以深度捆绑“推...
“推理甜点”海龟汤能成为新风口吗?
“很多剧本杀店里会把海龟汤当成‘餐前甜点’而不是主食,主要原因就是其社交属性并不强,仅仅靠着几个简单的问题和回答就能结束游戏,玩家也会觉得没有必要去线下听你问问题。”黄先生分析道。海龟汤相对较轻的体量和提问、回答的游戏方式,以及并不那么大的演绎空间,制约着其在线下拥有更多商业模式,甚至独当一面...
恐怖推理海龟汤故事,胆小慎入!
恐怖推理海龟汤故事,胆小慎入!(答案在底下)1.吃人的井从前有一家三口,单亲妈妈、儿子与女儿,某天儿子觉得自己的妹妹很吵,便把她杀了,丢进后院的井里,第2天之后妹妹的尸体却消失了,从此儿子杀人后,丢进井里的尸体只要一到隔天,一一的都消失了,直到15年后,儿子因为厌倦照顾年迈的母亲,便也把她杀...