送你一碗“海龟汤”
这道题其实就是一个很典型的“海龟汤”谜面,谜面本身就是一个场景(葬礼),有起因(遇到心上人),有结果(杀死姐姐),唯独缺少内在的逻辑联系,而答题者则需要补上内在的逻辑联系,有时候这个逻辑联系恐怖得毛骨悚人,或者脑洞大得异想天开。拿陈小生出的这道题举例,当然可能性有很多:可能是因为姐姐是妹妹心上人的梦...
我用2 万条真人 AI 海龟汤游戏数据,评估大模型推理能力哪家强
最终我选了32个相对不恐怖不违反伦理有逻辑的故事开始写代码基于最佳平替的代码,我很快完成了开发:点开一个故事,你有8次猜测机会猜测正确或次数耗尽就会公布答案产品取名汤很热为了增加沉浸感我给每个故事都配了插图和环境音不过,AI海龟汤游戏并不是本文的重点。大模型比人类更蠢产品发布后,有很多用户...
春藤夏院探秘海龟汤:故事背后的逻辑推理游戏
你可以通过描述一些看似无关紧要的细节来误导参与者,增加游戏的趣味性。3.控制难度:海龟汤的难度应该适中,既不能让参与者轻易猜出答案,也不能让他们感到无从下手。你可以通过调整关键信息的数量和难度来控制游戏的难度。4.检验答案:在发布海龟汤之前,自己先试着解答一下,看看答案是否合理,以及是否需要...
实测OpenAI新模型o1 :做题王者,实战青铜
不过,和AI玩推理游戏很有意思,可惜目前新模型的额度有限,o1-preview每周可以发30条,o1-mini每周是50条,为了避免浪费宝贵的提问次数,下面的又一道海龟汤题目,我要求o1-preview一次性提8个问题,然后根据我的回答直接给出答案。这次它的表现相当令人惊讶:o1-preview只思考了10秒,提出的问题全部直击要害,真相呼之欲出...
OpenAI 全新 o1 模型实战奥数、推理题:AI 水平又上新高度
一是,数学与逻辑能力强,速度还不慢。二是,能够通过模拟人类的思维过程,帮助模型逐步分解复杂问题。这也是OpenAI在官方介绍中提到的思维链(CoT),与人类在回答难题之前会长时间思考类似,o1在尝试解决问题时会使用思维链。比如在回答「海龟汤」问题的时候,会进行推测、预设、分析等。无论是解题思路或者是剧情还原,都...
大模型能代替你刷知乎、打炉石传说、解谜“海龟汤”吗?清华...
AgentBench包含8个不同的环境,其中5个是首次使用的环境:操作系统、数据库、知识图谱、数字卡牌游戏、横向思维谜题(即所谓的“海龟汤”游戏)(www.e993.com)2024年11月26日。其余3个环境是根据已发布的数据集重新编译的,包括家务、网购、网络浏览。上述所有数据集都经过设计与调整,来模拟交互式环境,使纯文本LLM可以作为自主的智能体运行。此外,Agen...
百变大侦探剧本杀新创“海龟汤积分赛”引热议
由出题者提出一个难以理解的事件,参与猜题者可以提出任何问题以试图缩小范围并找出事件背后真正的原因,但出题者仅能以“是(对)”、“不是(不对)”或“没有关系”来回答问题。在活动过程中,参与解密的玩家要通过自己的分析和解密一步步晋级,决出本次海龟汤比赛的最强优胜者。据悉,活动已于6月21日、6月...
国产悬疑第一IP地位不保?看肖央玩转流量密码!
“海龟汤”是一种情景推理猜谜游戏,其玩法是由出题者提出一个难以理解,不符合逻辑的事件,参与猜题者可以提出任何问题以试图缩小范围并找出事件背后真正的原因,但出题者仅能则以“是(对)”、“不是(不对)”或“没有关系”来回答问题。《误杀2》的开场,没有铺垫,提刀就上,但林日朗看似“完美”的犯罪却处处显...
国产悬疑第一IP地位不保?看肖央玩转流量密码!__财经头条
“海龟汤”是一种情景推理猜谜游戏,其玩法是由出题者提出一个难以理解,不符合逻辑的事件,参与猜题者可以提出任何问题以试图缩小范围并找出事件背后真正的原因,但出题者仅能则以“是(对)”、“不是(不对)”或“没有关系”来回答问题。《误杀2》的开场,没有铺垫,提刀就上,但林日朗看似“完美”的犯罪却处处显...
这个有些年头的“烧脑”游戏品类竟成了年轻玩家的新宠?
引入社交的好处不仅在于增强用户黏性,庞大的用户亦可自生产大量UGC向的谜题。并且,基于“海龟汤”游戏的强互动性,《海龟汤》还可以在游戏房间内构筑大量熟人社交及陌生人社交场景,甚至有一部分现实生活中本已相识的玩家也是通过该游戏慢慢熟络起来的。但需要注意的是,《海龟汤》与其说是一款游戏,倒不如说是一个混杂...