れおなちずむ

素粒子物理、量子計算、機械学習、計算機科学とかの話をします

2019-04-23から1日間の記事一覧

強化学習① - Markov決定過程

こんにちは~。 最近巷でホットな(深層)強化学習ですが、かくいう自分も1、2年前ぐらいにAlphaGoの熱に当てられて強化学習にハマりまして、そのときにちょっとした自分用のノートをつくりました。 その結果、ブラウザ上で深層強化学習をするAPIとかが生えた…