e993新闻网

热点新闻财经股市美股娱乐科技体育军事

e993新闻网 » 热点新闻

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

2024-07-10 12:19:14 - 新浪人工智能

机器之心报道

编辑：陈陈、小舟

不会写prompt的看过来。

在构建AI应用时，prompt质量对结果有着重大影响。但制作高质量的prompt具有挑战性，需要研究者深入了解应用需求，并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果，AI初创公司Anthropic简化了此流程，可以让用户更轻松地制作高质量的prompt。

具体来说，研究者为AnthropicConsole添加了新功能，可以生成、测试和评估prompt。

Anthropic提示工程师AlexAlbert表示：这是他们过去几周投入了大量工作才得到的成果，现在Claude在提示工程（PromptEngineering）方面表现得非常好。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

难写的prompt，交给Claude

在Claude中，写一个好的prompt就像描述任务一样简单。控制台提供了一个内置的prompt生成器，由Claude3.5Sonnet提供支持，允许用户描述任务并让Claude生成高质量的prompt。

生成prompt。首先点击GeneratePrompt，进入prompt生成界面：

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

然后输入任务描述，Claude3.5Sonnet将把任务描述转换为高质量的prompt。例如「撰写一个用于审查入站消息的prompt……」，点击生成prompt就可以了。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

生成测试数据。如果用户有了prompt，可能需要一些测试用例来运行它。Claude可以生成那些测试用例。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

用户可以根据需要修改测试用例，并一键运行所有测试用例，还可以查看并调整Claude对每个变量生成要求的理解，以实现对Claude生成测试用例更细粒度的控制。

这些功能让优化prompt变得容易，因为用户可以创建prompt的新版本并重新运行测试套件以快速迭代和改进结果。

此外，Anthropic还按照5分制为Claude响应质量设置了评分。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

评估模型。如果用户对prompt感到满意，之后可以在「评估」选项卡中一次针对各种测试用例运行它。用户可以从CSV导入测试数据，也可以直接使用Claude为用户生成合成测试数据。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

比较。用户还可以在测试用例中相互测试多个prompt，并对更好的响应进行评分，以跟踪哪个prompt表现最佳。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

AI博主@elvis表示：AnthropicConsole是一项出色的研究，其自动化设计和优化prompt的过程可以节省大量时间。虽然生成的提示可能并不完美，但给了用户一个快速迭代的起点。此外，生成测试用例功能也很有帮助，因为开发者可能没有可供测试的数据。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

看来，以后写prompt这个活，可以交给Anthropic了。

了解更多内容，请查看文档：https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

今日热搜

© 2024 e993新闻网

阿里巴巴关键词排名查询