| Up | 並列学習 | 作成: 2026-05-15 更新: 2026-05-15 |
複数の環境を同時に動かす ・進化的手法 複数のポリシー (脳) を同時に学習させる ・ドメインランダム化 複数の初期条件・パラメータで学習させる これは,つぎのようになる:, それぞれが勝手に学ぶ」 ○ 並列シミュレーション(Parallel Simulation) 100〜10,000体のロボットを同時に動かす 例: NVIDIA Isaac Gym では,1 GPU で 4096 体のロボットを同時に学習できる。 つぎのメリットがある: 多様な状況を同時に経験 学習が安定する ○ 複数モデルを並行して学習(Evolutionary RL) それぞれが Sim 内で歩行を学ぶ 最も優秀なポリシーを選ぶ そのポリシーを少し変異させて次世代を作る これを繰り返す ○ ドメインランダム化 重力 モータ性能 センサー誤差 これらをランダムに変えた複数環境を,同時に学習させる。 こうすることで,どんな環境でも動ける頑丈で壊れにくい Sim-to-Real が成功しやすい。 これも, |