腾讯公司申请图像生成模型专利，提高模型生成包含多个对象的图像的准确性

2024-06-03 20:10:21 - 金融界网站

转自：金融界

本文源自:金融界

金融界2024年6月3日消息，天眼查知识产权信息显示，腾讯科技（深圳）有限公司申请一项名为“图像生成模型的处理方法、装置、设备、存储介质及产品“，公开号CN202410518163.2，申请日期为2024年4月。

专利摘要显示，本申请实施例提供了一种图像生成模型的处理方法、装置、设备、存储介质及产品，该方法包括：获取包含多个对象的训练图像和训练图像对应的训练文本；从训练图像提取图像特征和各个对象的掩膜图像，从训练文本提取各个对象的文本特征；根据图像特征和各个对象的文本特征生成各个对象的注意力图像；根据训练图像、训练文本、各个对象的注意力图像和各个对象的掩膜图像的损失数据，对参考图像生成模型进行训练，得到目标图像生成模型。本申请实施例的技术方案可以在对模型的训练过程中，生成多个对象的注意力图像，并与多个对象的掩膜图像构建损失数据，有利于训练模型将文本中的实体词与图像中的对象对应，提高模型生成包含多个对象的图像的准确性。