Up OpenAI : DALL·E 初版 (2021) 作成: 2026-01-25
更新: 2026-01-25


    テキストプロンプトから画像を生成

    DALL·E 初版は純Transformer 型だが,
    DALL-E 2 以降は,拡散モデルとのハイブリッド型になる。

       R-FREE (2025) から引用・編集:
    256×256の画像を生成

    250M件の画像キャプション対 から学習した
    120億パラメータのTransformer により、
    テキストから多彩な画像をゼロショット生成できることを示しました。

    この成果は
      「巨大なデータセット+大規模モデル」
    による汎用画像生成の可能性を示す転換点となりました。