Sora“满月”了,但不止一个AI在新生
2024年3月17日 - 澎湃新闻
二是高效的token压缩:在DiT框架内提出了一个新的注意力模块,能够压缩键和值,显著提高效率,从而支持超高分辨率图像的生成。这些改进使得PixArt-Σ在模型大小(0.6B参数)上远小于现有的文本到图像扩散模型,如SDXL(2.6B参数)和SDCascade(5.1B参数),同时在图像质量和用户提示遵循能力上都有了显著提升。此外,PixArt-Σ...
详情
二是高效的token压缩:在DiT框架内提出了一个新的注意力模块,能够压缩键和值,显著提高效率,从而支持超高分辨率图像的生成。这些改进使得PixArt-Σ在模型大小(0.6B参数)上远小于现有的文本到图像扩散模型,如SDXL(2.6B参数)和SDCascade(5.1B参数),同时在图像质量和用户提示遵循能力上都有了显著提升。此外,PixArt-Σ...