Researchers gave AI curiosity and it played video games all day
https://thenextweb.com/artificial-intelligence/2018/08/23/researchers-gave-ai-curiosity-and-it-played-video-games-all-day/

AIに好奇心を実装、一日中ゲーム。

Open AI―イーロンマスクが共同出資したシンギュラリティ専門のシンクタンク―は好奇心による学習という広範な研究を扱った論文( https://pathak22.github.io/large-scale-curiosity/resources/largeScaleCuriosity2018.pdf )を発表した。

>abstract(要約)
>強化学習アルゴリズムは環境内でエージェントに対して”外部からの報酬”を十分配慮して設計するということが重要である。
>しかし、環境毎に有効な報酬設計を注釈すると拡張性に欠けるため、エージェントに対して”内的な報酬機能”を提供する意義はあると思われる。
>curiosity(好奇心)は予測誤差を報酬信号として利用するintrinsic reward function(内的な報酬機能)の一種である。
>この論文では:(a)purely curiosity-driven learning(純粋な好奇心による学習)の検証をAtari game suitを含む54の標準ベンチマーク環境等で実施した。
>(b)予測誤差処理において、 different feature spaces(複数の異なる特徴空間)を利用することの有効性を検証し、random features が多くのRL(強化学習)ゲームベンチマークで有効であることを示した。
>ただし、novel game levels in Super Mario Bros. などではlearned featuresの方がより一般化できることを示した。
>(c) stochastic setupsでのprediction-based rewards (予測ベースの報酬)に限界があることを実証した。
>ゲームプレイ実証動画とコードは https://pathak22.github. io/large-scale-curiosity/