ぼくがかんがえた世界最強のAIをつくるために、アメリカに行ってきた : 情熱のミーム 清水亮
https://japanese.engadget.com/2018/10/20/ai/
「たどり着いた研究室のボスはストーン教授。UTAustin Villaのリーダーであり、強化学習の第一人者だ」
「近年の彼らの中心課題は、単なる強化学習ではなく、継続的学習にある」

『強化学習が「終わりのあるゲームにおける状況判断の学習」だとすれば、継続的学習とは、「終わりのない戦いにおける状況判断の学習」についての手法である』

『今年の1月にピーター・ストーン教授らのチームが発表した新たな学習手法、「Deep TAMER」は非常に画期的なものだった』

https://i.imgur.com/KkR8xfL.jpg
「上図はGoogleが開発したA3CとDouble-DQNとDeepTAMERとの比較だが、全くスコアが上がっていかない他の手法に対し、Deep TAMERが圧倒的な差で短期間に高スコアを達成」
「面白いのは、わずか6分の学習で人間のテーマー(調教師)のスコアを塗り替え、さらに10分後には人間の熟練者のスコアさえも凌駕」