腾讯公司申请图像生成模型专利,提高模型生成包含多个对象的图像的准确性

2024-06-03 20:10:21 - 金融界网站

转自:金融界

本文源自:金融界

金融界2024年6月3日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“图像生成模型的处理方法、装置、设备、存储介质及产品“,公开号CN202410518163.2,申请日期为2024年4月。

专利摘要显示,本申请实施例提供了一种图像生成模型的处理方法、装置、设备、存储介质及产品,该方法包括:获取包含多个对象的训练图像和训练图像对应的训练文本;从训练图像提取图像特征和各个对象的掩膜图像,从训练文本提取各个对象的文本特征;根据图像特征和各个对象的文本特征生成各个对象的注意力图像;根据训练图像、训练文本、各个对象的注意力图像和各个对象的掩膜图像的损失数据,对参考图像生成模型进行训练,得到目标图像生成模型。本申请实施例的技术方案可以在对模型的训练过程中,生成多个对象的注意力图像,并与多个对象的掩膜图像构建损失数据,有利于训练模型将文本中的实体词与图像中的对象对应,提高模型生成包含多个对象的图像的准确性。

今日热搜