| Up | 状態の初期設定 | 作成: 2026-05-21 更新: 2026-05-21 |
「訓練が安定する初期姿勢」 それは,
関節角度は標準姿勢 角速度は 0 に近い 足は地面に接地 位置は (0,0) 姿勢は水平(ロール・ピッチは 0 付近) ただし訓練が進むと,訓練後のロバスト性を上げる方法として,「ドメインランダム化」を入れることがある。 初期姿勢を少し傾ける 初期位置を少しずらす 地面の摩擦をランダムにする 典型的な状態ベクトル s₀ の構造:
関節角度 : 12次元, 関節角速度 : 12次元, 足の接地状態 : 4次元, 位置・速度 : 6次元, 目標速度 : 3次元 シミュレーションツールの MuJoCo, Isaac Gym, Bullet などには,s_0 を設定する関数 reset() が含まれている。 |