Up
OpenAI : DALL·E 初版 (2021)
作成: 2026-01-25
更新: 2026-01-25
テキストプロンプトから画像を生成
DALL·E 初版は純Transformer 型だが,
DALL-E 2 以降は,拡散モデルとのハイブリッド型になる。
R-FREE (2025)
から引用・編集:
256×256の画像を生成
250M件の画像キャプション対 から学習した
120億パラメータのTransformer により、
テキストから多彩な画像をゼロショット生成できることを示しました。
この成果は
「巨大なデータセット+大規模モデル」
による汎用画像生成の可能性を示す転換点となりました。
参考/引用ウェブサイト
R-FREE (2025)「AI画像生成技術の仕組みと最新研究動向: GAN・拡散モデル・Transformerの進化と評価」