https://arxiv.org/abs/2301.04104v1

DeepMind、強化学習をより幅広い範囲に適応できる「DreamerV3」を発表
これは「世界モデルベース強化学習」と呼ばれる技術をより進化させたもの

世界モデルベース強化学習 とは
>「人間の高度な学習能力を支えているのは脳内シミュレータ―に基づく未来予測と行動計画である」という仮説のもと、
>脳内シミュレータを備えた強化学習エージェントを訓練しようというコンセプト

人間であれば4, 5回の試行錯誤で到達できるようなことを、
従来の深層強化学習では最先端でさえ何千回の試行錯誤が必要となるところを、
少数の試行でもそこそこのパフォーマンスを発揮できる