Up ハイパーパラメータ 作成: 2026-03-11
更新: 2026-03-11


    AI モデル (ニューラルネットワーク) の設計作業は,
    形式的には,つぎのものである:
      方程式 equation を組み,
      そして各方程式の変数に値を入れる

    NAS では,これをセル/ブロック単位でやる。ート


    翻って,訓練 Traning 前の AI モデル (ニューラルネットワーク) は,
      方程式を組み,変数に値を入れたもの
    のように見ることができる。
    この変数を,ハイパーパラメータと言う。


    「ハイパー」 と言ううからには,「ただのパラメータ」 がある。
    モデルは訓練で作られるが,この訓練で値が定まっていく重みパラメータが, 「ただのパラメータ」。
    それ以外が,ハイパーパラメータ。

    ハイパーパラメータは,アルゴリズムに属する。
    即ち,アルゴリズムで定数になっている項が,ハイパーパラメータである。


    アルゴリズムを 「テクスト」 と見ると,「文」 は,方程式の変数に値がはいったもの。
    テンプレートには,方程式をつくる 「部品」 が入っている。
    そしてコントローラが, 「部品」 を組んで方程式をつくり,方程式を組んでルゴリズムにする。

    例えば Attention や FFN の 計算アルゴリズは,「部品を組んでつくる」の見方をすると:
      Attention を使うかどうか,何種類か
      FFN の隠れ次元はいくつか
      層数
      ヘッド数
      正規化の位置はどこか
      skip の有無
      ブロックの数 (深さ),順序
      畳み込みのカーネルサイズ
      pooling の種類
      セルの接続パターン
    これらはすべて,アルゴリズムの "構造" に関わる項であり,
       設計で調節し,
       固定して訓練に進む
    という意味で,ハイパーパラメータである。