思考、思考、思考不停歇,思维树ToT“军训”LLM
2023年1月1日 - 腾讯新闻
下图5(a)显示了GPT-4在100个任务中的平均分数,其中ToT(7.56)比IO(6.19)和CoT(6.93)生成了更连贯的段落。虽然这样的自动度量可能会有噪声,但图5(b)证实,人类在100passage对中有41对更喜欢ToT而不是CoT,而只有21对更喜欢CoT而不是ToT(其他38对被发现“...
详情
下图5(a)显示了GPT-4在100个任务中的平均分数,其中ToT(7.56)比IO(6.19)和CoT(6.93)生成了更连贯的段落。虽然这样的自动度量可能会有噪声,但图5(b)证实,人类在100passage对中有41对更喜欢ToT而不是CoT,而只有21对更喜欢CoT而不是ToT(其他38对被发现“...