Up 言語ゲームAI と 「生成AI」 の関係 作成: 2026-01-27
更新: 2026-01-27


    言語ゲームAI は,「生成AI」のうち,応答生成をさらに言語ゲームとして行うものである。
    セッションのここまでの流れと整合的であるように,応答を生成する。

    言語ゲーム型の画像生成AI だと,ユーザは AI につぎのような注文をすることができる:
     「いまつくってもらった画像の上端から中央にかけて,
      淡い青のグラデーションを重ねてください。」

    現前の「画像生成 AI」は言語ゲーム型でないので,これはできない。


    画像生成を言語ゲーム型にしないのは,単に無理だから。
    前につくった画像の参照まで行うとなると,計算量が厖大になり過ぎて,計算資源が間に合わない。

    実際,言語ゲーム型の画像生成AI は,OpenAI の DALL-E 初版が最初で最後のようである。

    これは,
      120億パラメータの Transform
      250M件の画像キャプション対 による "Training"
    によって,
      256×256 の画像
    を生成することになったものである。
     ( OpenAI : DALL·E 初版 (2021))

    しかしこのスペックでは,実用にはならない。


    現前の「画像生成 AI」は,
      自然言語処理に,Transformer
      画像生成に,拡散モデル。
    のハイブリッド型が主流になっている。

    Transformer は,ユーザの入力したテクストを拡張モデルの入力に翻訳することが,役割である。
    「ユーザと拡散モデルのインタフェース」 の格好になる。

    ユーザは,プロンプトを色々変えて,生成画像をチューニングすることになる。
    前の画像生成は,AI の経験にならない。
    よって画像生成は,その都度,初めからやり直しである。
    このしくみにより,「これでよい」と思う画像に到達するのは,難しい。