OpenAI被全面超越:Claude高歌猛进,新的功能又来了

2024-07-10 13:38:00 - 华尔街见闻

新功能包括自动生成测试用例和并排比较输出,让用户能够优化提示并生成最佳响应。Claude3.5Sonnet驱动的提示生成器使提示编写变得简单,只需描述任务即可生成高质量的提示。

在构建AI驱动的应用程序时,提示(prompt)的质量对结果有重大影响。然而,编写高质量的提示具有挑战性,需要深入了解应用程序需求以及大语言模型(LLM)。为了加快开发速度并提升结果,Claude简化了这个过程,使用户能够更轻松地创建高质量提示。

现在,你可以在AnthropicConsole中生成、测试和评估你的提示。Claude增加了新功能,包括自动生成测试用例和比较输出的功能,让你能够利用Claude生成最佳响应。

生成提示

编写一个好的提示就像向Claude描述任务一样简单。Console内置了一个提示生成器,由Claude3.5Sonnet驱动。你只需描述任务(例如“分类处理客户支持请求”),Claude就会为你生成一个高质量的提示。

OpenAI被全面超越:Claude高歌猛进,新的功能又来了

你可以使用Claude的新功能生成测试用例,为提示提供输入变量,例如客户支持消息,并运行提示查看Claude的响应。或者,你也可以手动输入测试用例。

OpenAI被全面超越:Claude高歌猛进,新的功能又来了

生成测试套件

通过将提示与一系列真实世界的输入进行测试,你可以在将提示部署到生产环境之前,对其质量有更高的信心。使用新的评估功能,你可以直接在Console中进行此操作,而无需手动在电子表格或代码中管理测试。

手动添加或从CSV文件导入新的测试用例,或者使用“生成测试用例”功能让Claude自动生成。根据需要修改测试用例,然后一键运行所有测试。查看并调整Claude对每个变量生成要求的理解,以便更精细地控制生成的测试用例。

OpenAI被全面超越:Claude高歌猛进,新的功能又来了

评估模型响应并迭代提示

现在,优化提示变得更加简便,你可以创建提示的新版本并重新运行测试套件,以快速迭代和改进结果。Claude还增加了并排比较多个提示输出的功能。

你甚至可以让专家对响应质量进行5分制评分,以评估更改是否提高了响应质量。这些功能使改进模型性能的过程更加快捷和易于访问。

测试用例生成和输出比较功能对所有AnthropicConsole用户开放。

除此而外,Claude另外一个重磅功能也来了

Artifacts分享

真正的技术平权,每个人都可以用AI编写代码生成和发布自己的内容,也可以在别人的基础上修改,现在你可以分享Claude的Artifacts了(分享你的作品),别人也可以修改Artifacts。

OpenAI被全面超越:Claude高歌猛进,新的功能又来了

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

今日热搜