Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

2024-03-19 12:49:12 - 环球网

2024年3月18日，通用人工智能创业公司——月之暗面（MoonshotAI）宣布在大模型长上下文窗口技术上取得新的突破，Kimi智能助手已支持200万字超长无损上下文，并于即日起开启产品“内测”。对大模型超长无损上下文能力有需求的用户，可到Kimi智能助手网页版kimi.ai首页申请抢先体验。

据了解，Kimi智能助手是月之暗面（MoonshotAI）基于自研千亿参数大模型打造的对话式AI助手产品，在2023年10月发布时支持约20万汉字无损上下文输入，创造了消费级AI产品所支持的上下文输入长度纪录。2023年11月，Kimi智能助手正式面向全社会开放服务，出色的长上下文处理能力，帮助用户解锁了很多新的使用场景，包括专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等，获得了良好的用户口碑。

不到半年时间，月之暗面将Kimi智能助手的无损上下文长度提升了一个数量级，从20万字到200万字。由于没有采用常规的渐进式提升路线，月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能，月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发，不走“滑动窗口”、“降采样”等技术捷径，攻克了很多底层技术难点，才取得了新的突破。

媒体沟通会现场，月之暗面“抛砖引玉”，展示了一些超长无损上下文的使用场景示例。例如，用户上传几十万字的经典德州扑克长篇教程后，让Kimi扮演德扑专家为自己提供出牌策略的指导。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

上传一份完整的近百万字中医诊疗手册，让Kimi针对的用户问题给出诊疗建议。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

上传英伟达过去几年的完整财报，让Kimi成为英伟达财务研究专家，帮用户分析总结英伟达历史上的重要发展节点。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

上传一个代码仓库里的源代码，可以询问Kimi关于代码库的所有细节，即便是毫无注释的陈年老代码也能帮助你快速梳理出代码的结构。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

过去要10000小时才能成为专家的领域，现在只需要10分钟，Kimi就能接近任何一个新领域的初级专家水平。用户可以跟Kimi探讨这个领域的问题，让Kimi帮助自己练习专业技能，或者启发新的想法。有了支持200万字无损上下文的Kimi，快速学习任何一个新领域都会变得更加轻松。

快速整理大量的资料是很多用户在工作中经常遇到的挑战。现在Kimi能够一口气精读500个，甚至更多数量的文件，帮助用户快速分析所有文件的内容，并且支持通过自然语言进行信息查询和筛选，大大提高了信息处理效率。例如，公司HR可以基于业务需求，快速从最近的500份简历中，让Kimi快速找出有某个行业从业经历，同时从计算机类专业毕业的求职者，更加高效地筛选和识别合适的候选人。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

从长篇小说、故事或剧本中，重新发现值得玩味的蛛丝马迹，进行深层细节的挖掘，是很多影视娱乐IP的爱好者热衷的事情。如果将甄嬛传全集几十万字的剧本传给Kimi，然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。Kimi能在不同时间段、各个场景的故事情节中，深入挖掘甄嬛、果郡王的情感线以及和他们孩子的真相，堪比一个看了好几十遍电视剧的“甄”学家。

Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

“我们相信，大模型无损上下文长度的数量级提升，也会进一步帮助大家打开对AI应用场景的想象力，包括完整代码库的分析理解、可以自主帮我们完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。”月之暗面工程副总裁许欣然在媒体沟通会上表示，“无论是内存、算力还是网络带宽，历史上每一次基础技术的升级，都会解锁新的产品形态和应用场景。我们对200万无损上下文的Kimi可以带来哪些超出想象力的创新机遇充满期待。”

“通往通用人工智能（AGI）的话，无损的长上下文将会是一个很关键的基础技术。从word2vec到RNN、LSTM，再到Transformer，历史上所有的模型架构演进，本质上都是在提升有效的、无损的上下文长度。”月之暗面创始人杨植麟博士此前在接受采访时表示，“上下文长度可能存在摩尔定律，但需要同时优化长度和无损压缩水平两个指标，才是有意义的规模化。”

从很多Kimi智能助手用户的反馈来看，20万字的无损长上下文帮助他们打开了新的AI应用世界，带来了更大的价值，但随着他们尝试更复杂的任务、解读更长的文档，依然会遇到对话长度超出限制的情况。这也是大模型产品的无损上下文长度需要继续提升的一个直接原因。

此外，Kimi智能助手的智能搜索，更是离不开大模型的无损长上下文能力。Kimi主动搜索得到的多篇资料，会作为上下文的一部分交给模型去推理。正是因为Kimi大模型支持的上下文窗口足够长，窗口内的信息损失足够低，Kimi智能助手才能输出高质量的结果，为用户带来截然不同的搜索体验——Kimi可以根据用户的问题，主动去互联网上搜索、分析和总结最相关的多个页面，生成更直接、更准确的答案。例如，用户可以让Kimi主动去搜索和对比两家同领域上市公司的最新财报数据，直接生成对比表格，节省大量的资料查找时间。而传统的搜索引擎通常只能根据用户的问题，返回一些参杂着广告信息网页链接。

另一项与大模型的无损上下文能力息息相关的指标是指令遵循（InstructionFollowing）能力。指令遵循能力主要体现在两个方面：第一，模型在多轮对话中是否能够始终遵循用户的指令，理解用户的需求；第二，模型是否能够遵循复杂指令，有时候复杂指令可能长达几千、上万字。从产品推出以来的用户反馈来看，Kimi智能助手的多轮交互和超长指令遵循能力，也同样具备显著优势。

伴随模型能力的每日升级，iOS应用、Android应用、小程序、Web等多端平台的上线，Kimi智能助手已成为越来越多用户工作和生活离不开的AI小助手。3月18日启动200万字超长上下文的内测申请后，月之暗面会逐步开放更多用户来体验具备超长无损上下文能力的Kimi智能助手，期待与更多用户共创智能。