多语种翻译,跨模态文档理解,视觉合成,Backbone……12个去年刷爆...
2022年2月6日 - 腾讯新闻
「女娲」是一个统一的多模态预训练模型,在8种包含图像和视频处理的下游视觉任务上(Text-to-Image、Text-to-Video、VideoPrediction、Sketch-to-Image、ImageCompletionzero-shot、Text-GuidedImageManipulation(TI2I)zero-shot、Sketch-to-Video、Text-GuidedVideoManipulation(TV...
详情