Up 状態の初期設定 作成: 2026-05-21
更新: 2026-05-21


    状態 s_0 は,
      「歩行開始のための自然な姿勢」
      「訓練が安定する初期姿勢」
    が選ばれる。

    それは,
      ロボットは立位姿勢(少し揺れている程度)
      関節角度は標準姿勢
      角速度は 0 に近い
      足は地面に接地
      位置は (0,0)
      姿勢は水平(ロール・ピッチは 0 付近)


    ただし訓練が進むと,訓練後のロバスト性を上げる方法として,「ドメインランダム化」を入れることがある。
     例:
      初期姿勢を少し傾ける
      初期位置を少しずらす
      地面の摩擦をランダムにする


    典型的な状態ベクトル s₀ の構造:
      姿勢(IMU): 9〜12次元,
      関節角度 : 12次元,
      関節角速度 : 12次元,
      足の接地状態 : 4次元,
      位置・速度 : 6次元,
      目標速度 : 3次元
     合計:約 40〜50 次元のベクトル


    シミュレーションツールの MuJoCo, Isaac Gym, Bullet などには,s_0 を設定する関数 reset() が含まれている。