Up 歩行NN 作成: 2026-06-04
更新: 2026-06-04


    歩行 NN は,「高速で姿勢を安定させるための中位制御」。

    その内部構造は,つぎの3段階構成:

    ① 観測(Observation)
    歩行 NN は,つぎの情報を受け取る:
      IMU(姿勢:ピッチ・ロール・ヨー)
      関節角度
      関節角速度
      足裏の接地状態
      目標速度(前進・旋回)
      過去のアクション(1〜2ステップ)

    これらはすべて ベクトル化されて NN に入力される。


    ② 中間層(MLP:多層パーセプトロン)
    歩行 NN の中身は,いたってシンプル:
      全結合層(2〜3層)
      ReLU / Tanh
      128〜256ユニット程度

    5ms 以内に推論を終える必要から,小さくなければならない。


    ③ 出力(Action)
    NN の出力は,関節ごとの トルク指令 。
    (「どの関節にどれだけ力を入れるか」)

    例えば,
      12関節のロボット → 12次元の連続値
      値の範囲:[-1, 1]
      実際のトルクに変換するのは MCU