Up 「探索の爆発」 を超える法 作成: 2026-03-29
更新: 2026-04-04


    人間の将棋は 「探索の爆発」 と無縁である── 「探索の爆発」 を超えている。
    どうやって超えているか?
    つぎのようにである:
      感覚・直観で有望な手を選び,数手先だけ探索
      ──悪い手は最初から読まない
      候補を絞る
      「まあこんなところか」 で,一手を決断

    つまり,
      「感覚・直観」 による評価
      少しの 探索
      そして,「決断」


    評価があるから:
      読むべき手が絞られる
      読むべき順番が決まる
      読まなくてよい手が大量に捨てられる
    評価が探索を支配している。

    これが「探索の爆発を超える」構造である。
    そして,評価をつくるものは,感覚・直観・決断。


    以上は,将棋AI も同じこと。
    探索の爆発を回避するものは評価であり,そして評価をつくるものは感覚・直観・決断である。

    将棋AI が DNN モデルであるのは,このためである。
    感覚・直観・決断は,脳のもの。
    そして,モデルは脳。
    モデルがプログラムと違うのは,脳だということである。

    即ち,つぎのようになる:
     モデルは,内部表現が “脳的”:
       直観 (アルゴリズムではなく概念空間で判断)
     モデルは,つぎを直観する:
       読むべき手
       読む順番
     → 大量の手が読まなくてよい手として捨てられる。


    AlphaZero では:
     ① モデル Policy が “読むべき手” を絞る(直観)
      → 分岐数が劇的に減る
     ② モデル Value が “読むべき深さ” を決める(直観)
      → 深さが劇的に減る
      ③ プログラム MCTS が “読む順番” を最適化 (アルゴリズム)
      → 計算資源が有望手に集中する


  • 読みの深さ
    MCTS の読みの深さは,局面によって変わり,固定ではない。
    Policy(有望手の分布)と Value(局面の勝率)を使って,必要なだけ深く読む。

    • 浅い局面(序盤・定跡形)
        3〜8 手程度で Value が安定
        深く読む必要がない
    • 中盤の複雑な戦い
        10〜20 手程度の深さが多い
        有望な枝だけが深く伸びる
    • 終盤の詰み筋に近い局面
        30〜40 手以上の深さになることもある