送你一碗“海龟汤”
这个“是否与此无关”的游戏,其实在玩家圈子有个官方名字,叫“海龟汤”,又叫“情境猜谜”(situationpuzzle),谜面叫“汤面”,谜底叫“汤底”。打开WiFi万能钥匙,查看更多图片《名侦探学院》的“是否与此无关”和三国杀、狼人杀、剧本杀相类似,“海龟汤”也是一种社交类的推理游戏,只是它成本更低,且几乎不...
我用2 万条真人 AI 海龟汤游戏数据,评估大模型推理能力哪家强
收集用户在玩AI海龟汤游戏中输入的猜测,逐一进行人工标注(对、错、不相关),然后用这个数据集,测试大模型的评判结果相较于真实结果的准确率。我发现现有评测指标的种种问题在海龟Benchmark上都可以完美避开1.不需要额外背景知识。海龟汤游戏里几乎包含了推理所需的全部信息,一旦得知汤面和汤底,大模型就能作...
纯白笼梦花堕转猩红,枷岛海龟汤推理汤底揭晓!
现为大人奉上昨日☆枷岛海龟汤推理汤面☆的完整线索大人们推理出来了吗?直至谜底揭晓完整的故事逐渐显现枷岛的谜团却更为扑朔迷离不知何时会释放出更为骇人的真相……调查逐渐接近尾声灾厄的起因即将浮出水面——破译成功后恍然大悟的扫地工参上笼梦花为何猩红可怖?审讯记录·二完整线索公开——祸...
春藤夏院探秘海龟汤:故事背后的逻辑推理游戏
通过不断的提问和推理,参与者最终会发现,原来书房里有一架古老的钢琴,它的琴弦由于风吹日晒而松动,每到夜深人静时,琴弦就会自动振动发出声音。而由于宅院荒废多年,声音在空旷的房间里回荡,形成了悠扬的琴声。小伙伴们,海龟汤不仅是一个有趣的推理游戏,更是一个锻炼逻辑思维和创造力的好方法。如果你对海龟汤...
OpenAI 全新 o1 模型实战奥数、推理题:AI 水平又上新高度
目前OpenAI发布了o1-preview(高级推理)和o1-mini(更快的推理速度)两个版本,仅面向ChatGPTPlus和Team(个人付费版与团队版),而且提问次数有限,每位用户每周仅能向o1-preview发送30条消息,向o1-mini发送50条消息。基于此,多鲸依次选取小学奥数、阿里巴巴数学竞赛、LLM模型的经典必考「海龟汤...
AI智能体|海龟汤游戏实践,看你能拿多少分?
随着科技的发展和人们生活节奏的加快,越来越多的人开始寻求在休闲时光中放松身心、锻炼思维能力的娱乐方式,其中有一款很常见,也是很简单的情景推理游戏—-海龟汤(www.e993.com)2024年11月23日。于是我就尝试自己做了一款海龟汤游戏,分别尝试在智谱清言和coze两个平台上建立自己的智能体,其中无论是汤底的生成,还是对提问的判定,都由LLM生成,用户...
动漫游戏有哪些好玩 2024动漫游戏推荐
整个游戏以“海龟汤”类玩法为基础,考验着玩家的推理能力和观察能力。游戏画面简洁明了,文字描述清晰易懂,适合喜欢推理解谜的玩家。这款游戏是一款循环冒险游戏,玩家需要扮演主角,在一个错综复杂的时空背景下,解救一个注定要死亡的少女。游戏采用了有限的重复循环机制,每个循环时间为20分钟。游戏画面精美,剧情引人入...
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
小智推理出的答案是,西瓜可能有致命的细菌或者农药残留,不能否认其中有一定道理,但之后她似乎开始逐渐忘记海龟汤的游戏规则,居然反问我们还有什么具体细节,这个测试到此戛然而止。「人情味」背后的技术支撑据智谱在CNCC现场的发布介绍,AutoGLM是基于智谱GLM大模型家族的新成员——GLM-4-Voice情感语音模型...
相柳AI热度破亿,长视频平台押宝用户端AIGC
最后一类,在消费过一些悬疑推理剧目后,用户希望自己也能参与到推理的过程中。比如爱奇艺桃豆页面就有海龟汤,用户通过和系统的交互,逐步发现隐藏在背后的真相,目前《唐朝诡事录》《莲花楼》《猎罪图鉴》的海龟汤分别提供了在唐朝志怪、架空(类宋)武侠和现代世界观下的不同谜题和探案体验。
实测OpenAI 新模型 o1 :做题王者,实战青铜
可以说,o1-preview的推理能力的确提高了。进阶考验:情景推理慢于GPT-4o,但更准确接着是测试LLM模型的经典必考:海龟汤问题。一名男人发现自己少贴了一张邮票,随后便去世了。请问发生了什么事?海龟汤是一种推理游戏,出题人给出简短、模糊的故事背景,由玩家自己主动提问。出题人只会回答「是」和「不是」...