前回は、四足歩行のシミュレーションをランダム行動で実行しましたが、今回は学習させて正しく歩けるようにしてみます。
学習して実行
AntBulletEnv-v0 を学習させるコードは次のようになります。
[コード]
1 | import gym |
学習には時間がかかりますが、学習が成功すると3Dモデルが四足歩行で歩く様子を確認することができます。
前回は、四足歩行のシミュレーションをランダム行動で実行しましたが、今回は学習させて正しく歩けるようにしてみます。
AntBulletEnv-v0 を学習させるコードは次のようになります。
[コード]
1 | import gym |
学習には時間がかかりますが、学習が成功すると3Dモデルが四足歩行で歩く様子を確認することができます。
PyBullet環境 は、オープンソースの3D物理エンジン Bullet で実装された強化学習環境です。
オープンソースのため無料で利用することができます。
PyBullet をインストールするために次のコマンドを実行します。
1 | pip install pybullet |
今回は、四足歩行の3Dモデルを歩かせる AntBulletEnv-v0環境 を利用します。
ランダムで行動するコードは下記のようになります。
[コード]
1 | import gym |
上記コードを実行すると、四足歩行の3Dモデルが表示されます。
ただ今回はランダム実行のため、うまく歩くことはできません。
(Windowsだとうまく動作しなかったので、Ubuntuで動作確認しています。)
Update your browser to view this website correctly. Update my browser now