
Imagen
最后编辑于 2025年3月18日
Imagen 产品介绍
最先进的文本到图像转换技术
Imagen研究亮点
我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。在COCO上,我们实现了7.27的最新COCO FID并且人类评价者发现Imagen样本在图像-文本对齐方面与参考图像不相上下。