| Up | 言語ゲームAI と 「生成AI」 の関係 | 作成: 2026-01-27 更新: 2026-01-27 |
セッションのここまでの流れと整合的であるように,応答を生成する。 言語ゲーム型の画像生成AI だと,ユーザは AI につぎのような注文をすることができる: 「いまつくってもらった画像の上端から中央にかけて, 淡い青のグラデーションを重ねてください。」 現前の「画像生成 AI」は言語ゲーム型でないので,これはできない。 画像生成を言語ゲーム型にしないのは,単に無理だから。 前につくった画像の参照まで行うとなると,計算量が厖大になり過ぎて,計算資源が間に合わない。 実際,言語ゲーム型の画像生成AI は,OpenAI の DALL-E 初版が最初で最後のようである。 これは, 120億パラメータの Transform 250M件の画像キャプション対 による "Training" によって, 256×256 の画像 を生成することになったものである。 ( OpenAI : DALL·E 初版 (2021))
しかしこのスペックでは,実用にはならない。 現前の「画像生成 AI」は, 自然言語処理に,Transformer 画像生成に,拡散モデル。 のハイブリッド型が主流になっている。 Transformer は,ユーザの入力したテクストを拡張モデルの入力に翻訳することが,役割である。 「ユーザと拡散モデルのインタフェース」 の格好になる。 ユーザは,プロンプトを色々変えて,生成画像をチューニングすることになる。 前の画像生成は,AI の経験にならない。 よって画像生成は,その都度,初めからやり直しである。 このしくみにより,「これでよい」と思う画像に到達するのは,難しい。 |