ロボットアームなどの固定ロボットにおいて深層強化学習を適用した研究をサーベイした結果について報告する.ロボットの強化学習を難しくする要因の一つとして,現実での試行が時間的・安全性・コストの制約を受けることがあげられる.この問題に対するアプローチは二つに大別される.一つはサンプル効率の良い学習手法を用いること,もうひとつはシミュレーションを活用することである.前者については深層強化学習一般にお...