| Up | 「確率分布」 で思考停止 | 作成: 2026-03-19 更新: 2026-03-19 |
モデルを 「確率モデル」 と定めるのは論点先取だが,通説はこれが前提である。 よって,通説がモデルに関して 「確率」 を問題にする形は, この確率はどのようか? であり,つぎの形は,初めから問題にならない: そこに確率はあるのか? 通説は,「確率」 をつぎのように説く: テクスト生成は,次トークンが確率で決定 しかし,確率分布の形に埋め込まれているのを,見た者はいない。 そして,その確率分布の中身を考えることもしていない。 この構えは,「これは分かっていることだ」 と,そのうち説くことになる: 確率分布の形にその構造が埋め込まれる ── このことが分かっている 「確率分布」 を言い出すなら,これの中身を考えてもよさそうなものだが,考えない。 なぜか? 考えると, テクスト生成は,次トークンが確率で決定 にはならないからである。 もっとも,通説は自分が 「不都合を見ない・考えない」 だとは思っていない。 実際,つぎのように説く: 例1 「このときの次トークンの確率分布は 猫 0.40 犬 0.30 人 0.10 ‥‥… この確率分布から 最大値を選ぶ ランダムサンプリング などで,1つのトークン(one-hot) を決める。」 例2 「入力: 私は昨日 ___ を食べた 人間の実際の次トークンは ラーメン パン カレー など様々。 どれが正しいかは唯一ではない。 だから確率分布を出す。 そしてそこから一つ選ぶという方法で 自然な文が生成されることになる。」 上の例は, 「確率分布」 の実際が思考停止されている。 確率分布の数値は,例1のような大きな数値には,ならない。 「そこから一つ選ぶ」ができるような凸凹は,できない。 「不都合を見ない・考えない」 の言い方がきつく聞こえるとしても,「思考停止」 より穏やかな物言いは難しい。 通説は,「トークン」 「確率」 「確率分布」 を,つぎを連続にするものと思っている: 2. テクスト生成は,次トークンが確率で決定 そして,その連続を示せない。 しかし通説の立場は, この連続を示せないことは, この連続を否定するものではない 論理的には自家撞着だが,通説にとってこれは自家撞着ではない。 通説のこの思考様式は,「野生の思考」 と位置づけることになる。 |