| Up | 「奇妙な動き」 の意味 | 作成: 2026-05-13 更新: 2026-05-13 |
これは,報酬条件を満たしている。 報酬条件が緩ければ,“抜け道” として奇妙な行動が出現する。 例えば,報酬が エネルギー効率 体を震わせて前進する 地面を叩いて跳ねる これは 報酬ハッキング と呼ばれる。 AI は“人間の意図”を理解しない。 つぎのギャップが,「奇妙な動き」 の意味である: AI:「報酬が増えるなら何でもいい」 ロボティクス研究では,「奇妙だが最適な動き」がしばしば発見される。 奇妙な動きが出ても,それは 「目から鱗」 かも知れない。 奇妙な動きは “失敗” ではなく “発見” である 以下,「奇妙な動き」 に対する観点を挙げる: 歩くとはこういう動き 立つとはこういう姿勢 走るとはこういうリズム 報酬が増える行動なら何でもよい 倒れる 跳ねる 震える 地面を叩く 体をねじる 2. 強化学習は “局所最適” を見つけやすい 「今の状況で最も報酬が増える行動」 を選び続ける。 体を震わせて摩擦を利用する 足を変な方向に伸ばす 関節を高速で振動させる 3. 物理法則の “抜け道” を見つける 衝突判定の誤差 剛体モデルの限界 数値積分の誤差 摩擦モデルの誤差を利用して “滑り加速” する 衝突判定の隙間を使って “跳ねる” 数値誤差で “浮く” 4. ニューラルネットは “奇妙な連続動作” を生成しやすい 連続値の出力を高速に変化させることが得意。 微妙な角度で体を揺らす 足を高速にバタつかせる ニューラルネット+モータ なら可能。 |