(強いAI)技術的特異点/シンギュラリティ110

**オーバーテクナナシー** · 2018/02/13(火) 20:38:01.92

英ディープマインド、一つの学習から多数のタスク同時処理　大規模分散型のAI手法を開発
https://www.nikkan.co.jp/articles/view/00461636
「ある学習エージェントの経験を生かして、各エージェントがタスクをこなすだけでなく、エージェント間で学習内容を同時にアップデートできる。」
「このアルゴリズムを搭載した機械１台をトレーニングし、データ効率はそのままに何千台もの機械へのスケールアップも可能という」
『ディープマインドの深層強化学習について30のマルチタスク試験が行える「DMLab-30」や57のアタリのテレビゲームを同時に実行する「Atari-57」で試したところ、
ディープマインドが2016年に発表した分散型強化学習アルゴリズム「A3C」に比べてデータ効率が10倍と、10分の1のデータ量で済んだ』
「学習内容をエージェント間でシェアできることなどから性能も高く、ゲームではA3Cの２倍の得点が得られたとしている。」