強化学習における難しさとは?
論文の紹介。こういう基本的な前提に疑問を投げつけるののは良い論文だなぁ。今まで強化学習で有名なベンチマークは、実は簡素な近傍探索で出来てしまい、タスクの難しさとタスクを定義する関数の最適化の難しさは全く比例しないと。確かになるほど。
https://openreview.net/forum?id=ByL48G-AW
実際に世界の人工知能の研究者が、強化学習でどういう実験環境で
自分たちのモデルを研究しているか、ここを見て見てください。
意外にシンプルで驚くと思いますよ。