Up 言語ゲーム型画像生成モデルの規模 作成: 2026-01-25
更新: 2026-01-25


    言語ゲーム型の画像生成は,自己回帰的生成なので,
       巨大なデータセット + 大規模モデル
    が必要になる。

    OpenAI の DALL·E 初版 (2021年) は言語ゲーム型の画像生成AI であるが,これは,
      12億パラメータのTransformer
      250M 件の画像キャプション対で "Training"
    によって,
      256×256 の画像
    を生成。

    しかしこのスペックでは,実用にはならない。

    実際,言語ゲーム型の画像生成AI は,DALL-E 初版が最初で最後のようである。
    現前の「画像生成 AI」は,
      自然言語処理に,Transformer
      画像生成に,拡散モデル。
    のハイブリッド型が主流になっている。