CLIP介绍:连接文本和图像 https://openai.com/index/clip/. [OpenAI] Jan. 2021

CLIP(Contrastive Language-Image Pre-training)预先训练了一个图像编码器和一个文本编码器,以预测哪些图像与数据集中的哪些文本配对。然后,利用这种行为将 CLIP 转变为零样本分类器。将数据集的所有类别转换为标题,例如“一张狗的照片”,并预测 CLIP 估计的与给定图像最佳配对的标题类别。

imageClip

VAE(Variational Autoencoder)

IDDPM(Improved Denoising Diffusion Probabilistic Models)是一种改进的去噪扩散概率模型,它在生成模型领域取得了显著的成果。IDDPM 是基于 DDPM(Denoising Diffusion Probabilistic Models)的基础上进行改进的模型。

主要特点: