デープマインドの人
必要なのは、強化学習と報酬ポリシーを探求するだけ

課題
1 異なるセンサー情報の統合
2 その処理された情報からひとつの高度な報酬ポリシーを自動生成
3 高級生物特有の社会的関係(絆)の概念化
4 今のままだと一生かけても無理なので、少量のデータで学習できる方法

別の記事からまとめたやつを引用する

現実世界から情報収集するための異なるセンサーは、
数学においては数学空間を情報収集するための
一般化できるアルゴリズムが必要ということ
これは前から散々言われているけど
今のところ、まだできていない

新しいコンセプトを組み立てる想像力など"あらゆる面"で数学で人間に勝るには
1と2と4が必要