強化学習④ - Q関数の評価

強化学習の基礎についてまとめたノートの第四回です。

強化学習③ - Bellman方程式

強化学習の基礎についてまとめたノートの第三回です。

強化学習の基礎についてまとめたノートの第二回です。

こんにちは～。最近巷でホットな(深層)強化学習ですが、かくいう自分も1、2年前ぐらいにAlphaGoの熱に当てられて強化学習にハマりまして、そのときにちょっとした自分用のノートをつくりました。その結果、ブラウザ上で深層強化学習をするAPIとかが生えた…