腾讯公司申请数据处理专利,能实现从双语语料库的自动化高效翻译信息提取

2023-11-22 14:25:36 - 金融界网站

转自:金融界

本文源自:金融界

金融界2023年11月22日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“基于大型语言模型的数据处理方法、装置和设备”,公开号CN117094334A,申请日期为2023年8月。

专利摘要显示,本公开的实施例提供了一种基于大型语言模型的数据处理方法、装置、设备和计算机可读存储介质。本公开的实施例所提供的方法通过利用从双语语料库中获取的平行双语数据对大型语言模型进行微调,以基于经微调的大型语言模型和所设计的翻译信息提取指令从双语语料库中的平行双语数据和非平行双语数据自动且高效地提取翻译信息。通过本公开的实施例的方法能够利用大型语言模型的强大翻译能力,实现从双语语料库的自动化高效翻译信息提取。此外,通过外置显式地保存所提取的双语翻译信息,能够将翻译信息融入大型语言模型的翻译过程,从而进一步优化机器翻译性能。

今日热搜