/bin/osh

ソフトフェアエンジニアリングしたりデータ分析したりプロジェクトマネジメントの勉強したりする人のブログ

ChainerRL Quickstart Guideを和訳してDQNしてみた

ChainerRL

2017-02-16に公開された強化学習(Reinforcement Learning)のアルゴリズムをまとめたPythonのライブラリです.

Quickstart Guideも用意されています.

(布教+英語の勉強目的で)このQuickstart Guideを和訳してみたので公開してみます. Dropbox Paperに飛びます. ChainerRL Quickstart Guide JP

英語おかしかったら言ってください…

Quickstartしてみた

Quickstart Guideを参考にこんな感じにコード書いてみたら動いた. 16行目の env = gym.make('CartPole-v0')でOpenAI gymにある別のゲームにしてあげれば別のゲームを学習することができます. ちなみにCartPole-v0は棒のバランスを取るゲームです. python quickstart.py --trainで学習,python quickstart.py --load PATHでエージェントをロードして実行できます.

gist1a7f0f9e6d2dfccb2b7d2b9f3ba0235e