Hierarchical Temporal Memory (HTM) は、新皮質がこの様な機能を発揮する様子を モデル化する技術である。 HTM は人間と同等あるいはそれ以上の多くの認識性能 ry
ry 1章は HTM ry 階層構造 ry 、疎分散表現1、時間的な変化に基づく学習 ry 2章は HTM 大脳皮質性学習アルゴリズム2 ry 3章と第 4 章は HTM 学習アルゴリズムの疑似コードを、 空間プーリング及び時間プーリングの2つのパート ry 第2章から第4章を読めば、熟練したソフトウェア技術 ry 実装して実験 ry
1 sparse distributed representation。本書を理解する上で重要な概念だが、 冒頭で述べられているように、残念ながら本書では説明されていない。 理論的基礎は Pentti Kanerva 著 Sparse Distributed Memory に詳しい。 Kanerva 氏は Jeff Hawkins 氏が設立した Redwood Neuroscience Institute (現在は Redwood Center for Theoretical Neuroscience)の研究員。 2 HTM cortical learning algorithms 05485472016/11/11(金) 13:29:50.80ID:TfAJHR6G Page 9
ソフトウェアのリリース
ry ソフトウェアリリースは 2011 年中頃を予定している。
以前の文書との関係
HTM 理論の一部は 2004 年の On Intelligence3、Numenta 社から発行された ホワイトペーパー、Numenta の従業員が執筆した論文など ry 2章から第4章で述べている HTM 学習アルゴリズムは、これまで発表されたことはない。 この新しいアルゴリズムは、Zeta 1 と呼ばれていた我々の第一世代アルゴリズムを置き換 ry 新しいアルゴリズムのことを “Fixed-density Distributed Representations” ないし “FDR” と呼んでいた ry HTM 大脳皮質性学習アルゴリズム4、あるいは単に HTM 学習アルゴリズムと呼んでいる。
我々は、Numenta 社創設者の一人である Jeff Hawkins と Sandra Blakeslee によって書かれた On Intelligence ry この本は HTM という名前で述べてはいないものの、 それは HTM 理論とその背景にあるニューロサイエンスについて、 読みやすくかつあまり技術よりにならずに説明している。On Intelligence が執筆された当時、 我々は HTM の基本原理を理解していたが ry 実装する方法を知らなかった。 ry
Numenta 社 ry
Numenta, Inc. (www.numenta.com)は HTM 技術を商業的ないし学術的利用のため ry 進捗及び発見を完全に文書化している。我々はまた、我々が開発したソフトウェアを 他の人が研究目的や商業目的で利用できるように提供 ry アプリケーション開発コミュニティが立ち上がることを支援 ry Numenta 社のソフトウェアや知的所有権を研究目的で自由に利用
ry 小さなサブセットを実装 ry 今後より一層多くの理論が実装されるだろう。 現在我々は、新皮質の商業的ないし科学的価値のうちの十分なサブセットを実装したと信じる。
HTM のプログラミングは伝統的なコンピュータプログラミングとは異なる。 ry HTM はセンサーから得られたデータの流れに触れることで訓練される。 HTM の能力はそれがどのようなデータに触れたかによって ry
ry 「ニューラルネ ry 」という用語は非常に多くのシステムで用い ry 不用意に使えない。 HTM がモデル化するニューロン(HTM ではセル5と呼ぶ)は、 カラム6、層7、リージョン8、階層構造9の中に配置 ry HTM は基本的にメモリベース ry 。HTM ネットワークは時間的に変化する たくさんのデータによって訓練され、多くのパターンとシーケンス10の蓄積に依存している。 データを格納及びアクセスする方法は、一般にプログラマが使用する標準的なモデルとは論理的に異 ry 。伝統的なコンピュータメモリはフラット ry 時間に関する概念を持たない。 ry
ry 。HTM のメモリは階層的な構造であり、時刻の概念が内在している。 情報は常に分散型の様式で保存される。HTM の利用者は階層のサイズを指定し、 何に対してそのシステムを訓練するのかを決める。 ry
HTM ネットワークは ry 、階層構造、時間と疎分散表現( ry )の主要機能を包含する限り、 我々は汎用的なコンピュータを使ってモデル化することができる。 我々はいずれ、HTM ネットワークに特化したハートウェアを作ることになる ry
本書では我々は HTM の特徴と原理を、人の視覚・触覚・聴覚・言語・行動を例にして表す。 ry 。しかしながら、HTM の能力は汎用的であることを心に留め ry 。HTM は学習と予測の機械であり、様々な種類の問題に適用可能である。
HTM 原論
ry なぜ階層的な組織が重要なのか、HTM のリージョンはどのように構成されるか、 なぜデータを疎分散表現で格納するのか、なぜ時間ベースの情報がクリティカルであるのか。
階層構造 ry 。リージョンは HTMにおける記憶と予測の主要構成要素 ry 。 通常、各 HTMリージョンは階層構造の 1 レベルを表す。 階層構造を上がるに伴って、常に集約11がある。 子リージョンの複数の要素が親リージョンの一つの要素に集約 ry 階層構造を下がるに伴って、フィードバック接続による情報の発散12がある。 (リージョンとレベルはほとんど同義 ry 。リージョンの内部的な機能 ry 「リージョン」の用語 ry 、特に階層構造の中でのリージョンの役割を指すときに「レベル」の用語を用いる)
階層 ry 効率 ry 各レベルで学習されたパターンが上位のレベルで組み合わせて再利用 ry 学習時間とメモリ消費を非常に節約する。 説明のため、視覚 ry 。階層構造の最下位レベルでは、 脳は縁13や角などの視覚のごく一部分に関する情報を格納する。 縁は ry 基本的な構成要素である。これらの下位レベルのパターンは中間レベルで ry 曲線や模様などのより複雑な構成要素に集約される。 円弧は耳の縁 ry 車のハンドル ry カップの取っ手 ry 。これらの中間レベルのパターンはさらに集約されて、頭、車、家などの 高レベルな物体の特徴を表す。 高レベルな物体 ry 、その構成要素を再度学習する必要がなくなる。
ry 単語を学習 ry 文字や文節、発音を再度学習する必要はない。
階層構造間で表現を共有 ry 、予期される行動の一般化にもなる。 ry 動物を見 ry 、口や歯を見 ry 食 ry 噛 ry 予測 ry 。階層構造により、 ry 新しい物体がその構成要素が持つ既に分かっている特徴を 引き継いでいることを知ることができる。 05585572016/11/15(火) 17:26:54.57ID:miLjs+zj 一つの HTM 階層構造はいくつの事柄を学習 ry ? 言い換えれば、階層構造にはいくつのレベルが必要 ry ? 各レベルに割り当てるメモリと、必要なレベル数の間にはトレードオフ ry HTM は入力の統計及び割り当てられたリソースの量とから、 各レベルの最適な表現を自動的に学習 ry 多くのメモリを割り当 ry レベルはより大きくより複雑な表現を構成し、 従って必要となる階層構造のレベルはより少 ry 少ないメモリ ry 小さく単純な表現を構成し、 ry レベルはより多 ry
ここからは、視覚の推論14のような難しい問題について述べる (推論はパターン認識と似 ry )。しかし多くの価値ある問題は視覚より単純で、 一つの HTM リージョンでも十分 ry Web ry どこをクリックするか予測 ry 。この問題は、一連の Web クリックのデータをHTM ネットワークに流し込 ry 。この問題では空間的階層構造はわずか ry 。解決策は主に時間的な統計 ry 一般的なユーザのパターンを認識することで、 ry どこをクリックするかを予測 ry
まとめると、階層構造は学習時間 ry メモリ消費を節約し、一般化 ry しかしながら、単純な予測問題の多くは一つの HTM リージョンでも解決 ry
リージョン 階層構造に連結されたリージョン15の表現は、生物学から ry 新皮質は厚さ 2mm ry 。生物学では主にそれらが互いにどのように接続 ry 基づいて、新皮質を異なる領域ないしリージョンに区分けする。 あるリージョンはセンサから直接入力 ry 、他のリージョンは他のいくつかのリージョンを経由 ry 。階層構造を決 ry ージョ ry ョンへの接続関係 ry
新皮質のすべてのリージョンの細部は似 ry サイズや階層構造の中のどこに位置 ry 違 ry 、その他は似ている。 厚さ 2mm の新皮質リージョンを縦にスライスしたなら、6 つの層 ry 。 5 つはセルの層で、1 つはセルではない層である(少しの例外 ry )。 新皮質リージョンの各層はカラム状に数多くの相互接続されたセルがある。
HTM リージョンもまた、高度に相互接続されたセルがカラム状に配列された皮 ry 新皮質の第 3 層はニューロンの主要なフィード・フォワード層である。 HTM リー ry のセルはおおまかに言えば新皮質のリー ry 3 層にあるニューロンと等価 ry
図 1-3 HTM リージョンの区画。 ry 。セルは二次元のカラム状 ry 図では、1 カラム当たり 4 つのセル ry 小さな区画 ry 。各カラムは入力
15 region。体の部位、局部など ry 05625612016/11/18(金) 23:35:37.68ID:fnVQMg28 Page 16
の一部に接続され、各セルは同一リージョン内の他のセルに接続する( ry 図 ry ない)。 この HTM リージョン及びそのカラム構造は新皮質リージョンの一つの層に等価 ry
HTM リージョンは新皮質リージョンのほんの一部と等価であるに過ぎないものの、 複雑なデータ列の推論と予測 ry 多くの問題に有益 ry
疎分散表現 新皮質のニューロンは高度に相互接続しているが、わずかなパーセンテージのニューロン だけが一度にアクティブになるように抑制ニューロンによって保護されている。 よって脳内の情報は常に、数多く存在するニューロンのうちのわずかなパーセンテージ のアクティブなニューロンによって表されている。この様なコード化は「疎分散表現」 ry 「疎」とは、わずかなパーセンテージのニューロンだけが一度にアク ry 。一つのアクティブなニューロンは何らかの意味表現に関わっているが、 いくつかのニューロンの文脈の中で解釈されて初めて完全に意味 ry
ry HTM リージョンの記憶の仕組みは疎分散表現に依存 ry 。 ry 入力 ry 疎であるとは限らないので、HTM リージョンが最初に ry 疎分散表現に変換 ry
ry リージョンが 20,000 ビットの入力 ry 。入力ビットの中の”1”や”0”の割合は、時間と共に非常に頻繁に変化 ry ry 、またあるときは 9,000 個のビットが”1”であったりする。 HTMリージョンはこの入力を 10,000 ビットの内部表現に変換して、 入力 ry の 2%にあたる 200 ビットが一度にアクティブになるようにする。 ry 入力が時間と共に変化するに従って、内部表現もまた変化するが、 10,000 ビットのうち約 200 ビットが常にアクティブになる。
リージョン内で表現可能なものの数よりも起こりうる入力パターンの数の方が ずっと大きいから、この処理によって多くの情報が失 ry 、と思 ry 。しかしながら、どちらの数も途方もなく大きい。 ry どのようにして疎表現を作成 ry 後述する。 ry 情報のロスは ry 問題にならない。 05635622016/11/19(土) 21:31:34.61ID:gXSL1qpI Page 17
図 1-4 HTM リージョンのセルが疎分散的にアクティブ ry
時間の役割 時間は、学習・推論・予測において極めて重要 ry
時間を用いなければ、我々は触覚や聴覚からほとんど何も推論できない。 ry 目が不自由だとして、誰かが貴方の手の上にりんごを置い ry 。りんごの上で指を動かせば、触覚から得られる情報が常に変化しているにも関わらず、 ry 貴方が持つ「りんご」という高レベルの認識 ― は変化しない。しかし ry 手や指先を動かしてはいけない ry レモンではなくりんごであると識別するのは非常に難 ry
同じことは聴覚 ry 。変化しない音はわずかな意味しか持たない。 「りんご」という言葉や、誰かがりんごを噛んだときの音などは、 時間と共に素早く順序的に変化する数十から数百の音階の列 ry
視覚は対照的に、混在したケースである。 ry 一瞬だけ ry でも識別可能 ry 必ずしも時間的な入力の変化を必要としない。しかし ry 常時、目や頭や体を動かしており、物体もまた周囲を動き回 ry 。素早 ry 視覚的変化 の中から推論する我々の能力は、視覚の統計的な特徴と長年の訓練によってもたら 05645632016/11/20(日) 22:51:17.90ID:gBNtPa9o Page 18
される特別なケース ry
学習について見てみよう。 ry HTM システムは訓練の間、時間的に変化する入力に触 ry 。視覚では静的な画像の推論がときには可能なものの、 物体がどのようなものであるかを学習するため ry 変化する様子 ry 犬が ry 走ってくる様子 ry 網膜に一連のパ ry 、数学的に言えばそれらのパターンはほとんど似ても似つかない。 脳はこれらの異なるパターンが同じ ry 順序的な変化を観察することによって知る。 時間はどの空間的なパターンが一緒に現れるかを教えてくれる「先生」である。
センサから得られる入力が変化するだけ ry 無関係な入力パターンが続けて現れても 混乱するだけ ry 。また、ry 、非人間的なセンサも ry 適用できる点にも注意 ry 。もし発電所の温度・振動・雑音のパターンを認識するように HTM を訓練 ry これらのセンサの時間的な変化からもたらされるデータで訓練 ry
ry HTM ネットワークは多くのデータで訓練 ry 。HTM アルゴリズムの仕事は、 データの時系列の流れ ry どのパターンに続いて ry ーンが現れるかというモデルを構築 ry 。この時系列がいつ始まりいつ終わるのかがわからないので、この仕事は難しい。 同時に複数の時系列が重なりあって起こることもある。 学習は継続的に行われ、またノイズがある中で行われなければならない。
シーケンスの学習と認識は予測を形成する基準 ry ーンが他のどのパターンに続くかを HTM が学習すれば、 ry 現在の入力とその直前の入力に対して 次にどのパターンが現れる可能性が高いかを予測 ry
HTM の 4 つの基本的な機能に戻ろう:学習・推論・予測・行動16である。 各 HTMリージョンは最初の 3 ry 、学習・推論・予測を実行 ry しかし ry 行動は異なる。 生物学によれば、多くの新皮質のリージョンが行動を形成 ry しかし我々は、多くの興味深いアプリケーションにおいてこれは重要ではないと信
16 behavior 0565yamaguti~貸2016/11/21(月) 23:55:02.41ID:6/tm5rB/>>554 AI エンジン ハードウェア http://news.mynavi.jp/articles/2016/05/20/deep_insights/001.html > 高効率の人工知能ハードウェアを開発するDeep Insightsを創立 ry > 開発するハードウェアはノイマン型 ry Deep Learningなど ry 大幅に高速化 ry > 7nmプロセスを使って速度と集積密度の双方を上げることで10倍、 > 磁界結合による ry を多チャンネル化(メモリ帯域100TB/s)してダイ上に ry 10倍、 > ダイナミックな計算精度変更を可能にして、低精度演算 ry 10倍 ry 全体では1,000倍 0566yamaguti~貸2016/11/22(火) 23:37:39.81ID:fDw5z9zc > ダイナミックな計算精度変更
学習 HTM リージョンは ry パターンとパターンのシーケンスを見つけることで、 その世界を学習する。 ry 入力が何を表しているのかを「知って」はいない。 ry 統計的 ry 入力ビット ry 頻繁に同時に起こる組み合わせを見ている。 ry これを空間的パターンと呼 ry パターンが時間と共にどのような順で現れるか ry これを時間的パターンないしシーケンスと呼んでいる。
ry 入力が建物の ry センサであるなら、リージョンは建物の北側や南側において、 ある温度と湿度の組み合わせがしばしば起こることを見つけるだろう。 そしてこれらの組み合わせが毎日移り変わる様子を学習 ry
ry 入力があるお店の購入に関する情報 ry 、週末にある種の雑誌が購入される ry 、天候が寒いときはある種の価格帯のものが夕方頃に好まれることを ry
一つの HTM リージョンは学習の能力が限定されている。 ry どれだけのメモリ ry 入力が ry 複雑 ry に応じて何を学習するかを自動的に調整する。 ry メモリが削減 ry 学習する空間的パターンはより単純 ry メモリが増加 ry 複雑になりうる。学習した空間的パターンが単純であれば、 複雑な画像を理解するにはリージョンの階層構造が必要となりうる。 我々はこの特徴を、人の視覚システムに見る ry 。網膜から情報を受け取る新皮質のリージョンは、 視覚的な小さな領域についてだけ、空間的なパターンを学習する。 階層 ry を経由した後にだけ、視覚の全体像を認識する。 05685672016/11/23(水) 12:52:31.78ID:IM1cuRG2 生物的システムと同様に、HTM リージョン ry オンライン学習 ry 新しい入力を受け取るごとに継続的に学習する。 学習 ry 推論が改善されるが、学習フェーズと推論フェーズとを分ける必要はない。 ry
推論 HTM が周囲の世界のパターンを学習すると、新しい入力について推論ができ ry 、以前に学習した空間的ないし時間的パターンと照合 ry 入力が以前に格納したシーケンスとうまく適合 ry が、推論とパターンマッチングの本質 ry
メロディをどうやって理解 ry 最初の音 ry 次の音 ry 十分では ry 普通は3,4,ないしそれ以上の音 ry 。HTM リージョンの推論も似 ry 継続的に入力列を見て、以前学習したシーケンスと照合 ry シーケンスの最初から ry が普通はもっと流動的で、 ry メロディがどこから始まっても貴方が理解できることと似 ry HTM リージョンは分散表現を用いるので ry シーケンスを記憶ないし推論することは上記のメロディの例よりも複雑 ry
貴方がセンサから新しい入力 ry すぐに明確になるとまでは言えないものの、 慣れ親しんだパターンを ry 容易に見つける ry 、例え老人であっても若い人 ry 、ほとんどの人が話す「朝食」という言葉を理解できる。 同じ人が同じ「朝食」という単語を百回発音しても、その音は二度と、 貴方の蝸牛殻17(音の受容体)を正確に同じように刺激することはないにも関わら ry 05715702016/11/27(日) 07:36:49.57ID:vHhUl6EA HTM リージョンも脳と同じ問題に直面する:入力は決して正確に繰り返されない。 さらに、ちょうど脳と同じように、 ry 推論や訓練の最中にも新しい入力 ry 対処する一つの方法は、疎分散表現 ry 。疎分散表現の鍵となる特徴は、パターンの一部
> ry 大きく分けて領野間 ry マクロ・コネクトームと、 ry ニューロン間のシナプス結合を表すミク ry
> 新皮質は6層 ry 、階層内(横方向)はミクロ・コネクトームによる密結合であり、主に時間系列 ry > 。階層間(縦方向)はマクロ・ ry 疎結合であり、主に静的パターンを処理する。 > 最下層では知覚の入力および筋肉への出力が行われ、最上層は意識あるいは論理的思考を司る。 > 階層を上昇する情報はフィードフォワード(FF)あるいはボトムア ry 下降 ry バック(FB)あるいはトップダ ry > 。これらの情報の流れはベイジアンネットワークの性質 ry
> ry 。深層学習におけるバック・プロパゲーションはFBとは別物である。実際の脳ではFB情報が重要 ry > 。FF情報とFB情報は必ずしも対称的ではない。FB情報の方がむしろ多 ry > 。さらに重要なのは階層内からの情報である。下の階層からくる情報は全体の5-10%にすぎない。 > ry HTM理論では階層内の横からの情報は遷移確率のような時間的情報である。 > ry 、ゼータ1ではFBを扱うがCLAでは扱えず、これはCLAの欠点である。
> 新皮質の6層構造間と領野間の情報の流れについても解明が進んでいる。 > 新皮質への情報はまず4層に入り、そこから2/3層に送られる。 > さらに上の階層へは直接の経路と視床を経由する2種類がある。 > 5層は運動を支配している。 > 6層からはFBで1層に入る。 > CLAアルゴリズムでは4層と2/3層は実装されているが、5層と6層は実装されていない。 05765752016/12/02(金) 18:45:32.64ID:HgThED5J > HTM理論の解説 > > ry 発展に伴い実装 ry 。Numentaの資料により初代のゼータ1 から CLA, Gen3, そして将来の Gen4 ry > 。以下では ゼータ1, CLA, Gen3 ry > ゼータ1 ry 、教師なし学習、木構造の階層構造、上の階層ほど空間的・時間的に不変性 ry > 、バッチ学習、学習と推論フェーズの分離 ry > 。学習は階層ごとに行われ、階層を上がるに従い空間プーリングと時間プーリングによ ry 不変性 ry > 。下層から上層へのFFだけでなく、上層から下層へのFBも実装されている。 > Vicarious ではゼータ1を発展させた Recursive Cortical Network 理論が実装 ry CAPTCHA を破る ry > > CLAは神経科学の知見を取り込み、 > 神経細胞の細胞体、基底樹状突起、遠隔樹状突起、尖端樹状突起、軸索などとモデルを対応付けている。 > 新皮質の6層構造において情報は三方向 ry 下の階層、上の階層、同じ階層の横方向から入ってくるが、 > 下からの入力は5%ほどで、残りの95%は上と横 ry 。CLAにおいては遠隔樹状突起を経由しての横方向 > からの入力を扱うことが、通常のニューラルネットワークの理論と異なっている。 > > CLAの主な特徴は、空間プーリング、時間プーリング、SDR (Sparse Distributed Representation, スパース表現) > によるデータ表現である。空間プーリングとは、ry 。時間プーリングとは、 ry 。 > SDR は、一つのパターンを多数のニューロン(コラム)のうちの複数のニューロン(コラム)で表現することで、 > 豊富な表現力と頑強性を実現している。実際の脳ではSDRが採用されている。 > ry 反対に一つのパターンを一つのニューロンで表現する方法は Point Neuron あるいは Localist 表現と呼ぶ。 > SDRの幾何学的表現は、基底樹状突起をHTM空間における短いベクトルとし、 > 下の階層の長いベクトルを多数の短いベクトルの和として表現していると考えられる。 > これをSDRのハリネズミモデル ry モデルの具体例として脳の集団符号化方式がある。 > Gen3 は CLA の後継として Numenta が2014年 ry 05775752016/12/03(土) 12:21:12.63ID:97cte86A>>575-576 http://webcache.googleusercontent.com/search?q=cache:wba-initiative.org/wp-content/uploads/2015/05/20160518-wba14-matuda.pdf05785702016/12/04(日) 17:39:24.40ID:VL9xSNhJ Page 21
分だけをマッチングするだけでほぼ確実にマッチ ry
予測 HTM の各リージョンはパターンのシーケンスを格納する。 ry 現在の入力とマッチングすることで、次に到着すると思われる入力の予測をする。 ry 実際には疎分散表現の間の変遷を記録する。 あるときはその変遷はメロディの中の音に見られるように線形のシーケンスであるが、 一般的な場合は将来入力される可能性があるものが同時に多数予測される。 HTM リージョンはときには長期間に及ぶ過去の文脈に基づいて異なる予測をする。ry 。
HTM の予測の鍵 ry
1) 予測は継続的 ry 貴方は特に意識していなくても継続的に予測 ry HTM も同じ ry 歌 ry 次の音 ry 。階段 ry 足がいつ次の段に触れるか ry 予測と推論はほとんど同じ ry 。予測は分離された処理ではなく ry 統合 ry
2) 予測は階層構造のすべてのレベルのすべてのリージョンで起こる ry 。リージョンはそれが既に学習したパターンについて予測 ry 。言語の例では、低レベルのリージョンでは次の音素を予測し、高レベル ry 単語や句 ry 05795782016/12/04(日) 17:40:14.36ID:VL9xSNhJ 3) 予測は文脈依存 ry 予測は過去に何が起こったか、そして現在何が起こっているかに基づいて行われる。 従って直前の文脈に基づいて、ある入力から異なった予測が行われることがある。 HTM リージョンは必要なだけのより多くの直前の文脈を用いて学習し、 短時間ないし長時間の両方の文脈を保持 ry 可変長記憶18 ry 例えば、暗唱 ry ゲティスバーグ演説19 ry 。次の単語を予
18 variable order memory 19 Gettysburg Address。「人民の人民による人民のための政治」のフレーズが有名。 ”Four score and seven years ago our fathers brought forth on this continent, a new nation, conceived in Liberty, and dedicated to the proposition that all men are created equal...” (以下略) 0580yamaguti~貸2016/12/05(月) 18:56:24.50ID:s5+vq0Ta 第五世代コンピュータ計画 = 大成功
2 > 理論が大事 ry 。やってみたら出来ました、結果が出ましたという研究が多い。 > ディープラーニング ry は、入力情報と出力情報を一致させる同じニューロン数から成る恒等写像を > 作ることを繰り返すのだけど、その際、途中(中間層)でニューロン数を絞るので非線形の情報圧縮が起き、 > ry 圧縮 ry 。だけど、それが何故上手くいって、何をやっているのかを理論的に解明しないと、 > 大きな飛躍にはならないと思います。 ry > 理論研究は世界的にあまり進んでいなくて、みんな使ってみて結果を出すことに熱中
5 > ディープラーニングに関しては、もっと数理をやらないと底が浅い話 ry 危惧 ry > 使ってみたら出来ましたっていう研究 ry も良いと思いますが、 > 僕らは数理の研究者なので、どうして上手くいくのかが分からないと僕らの研究にはならない 05875862016/12/10(土) 01:59:36.18ID:O8le5YJ4http://www.sankeibiz.jp/smp/aireport/news/160605/aia1606050700001-s3.htm > 「ディープラーニングを使って、動的なものすなわち時空間のダイナミクスを扱おうとすると、 > これまで失敗してきたことの繰り返しになると思います。 > ニューラルネットワークを使って、時空間のダイナミクスを扱う研究は何十年もされてきてはいますが、 ry > 。むしろ、そういった時空間情報を扱う手法は、既に数学的に ry 。ディープラーニングは要素技術としては
測するには、現在の単語だけでは全く不十分 ry ”and” の次に “seven” が来ることもあれば、 ry 。ときにはほんの少しの文脈で予測 ry “four score and” と分かれば次の “seven”を予測できる。 他の場合はフレーズが繰り返される場合 ry 、より長い文脈を使う必要がある。
4) 予測は安定化に ry あるリージョンの出力はその予測である。 HTM の特徴の一つは、リージョンからの出力はより安定 ry 。安定とはつまり、階層構造の上位に行くほどよりゆっくりと変化し、長く継続 ry 。リージョンは ry 可能なときは時間軸の複数ステップ先 ry 5 ステップ先 ry 。新しい入力 ry 、新たに予測されたステップは変化するが、 しかしそのうちの 4 つの既に予測されたステップは変化しない。 ry 、出力の一部だけが変化するので、出力は入力よりも安定化している。 ry 。 歌の名前のような高レベルの概念は、 ry 音のような低レベルの概念よりもゆっくり ry
5) ry 、新しい入力が予期されたものか予期しないものかが分かる 各リージョンは ry 、予期せぬ事 ry 知ることができる。 HTM は次の入力として起こりうる ry 一度に多数予測 ry 正確に予測できるわけではないが、 ry どの予測にも一致しないとき、何か普通でないこと ry
6) 予測はシステムをノイズにより強く ry HTM ry 、推論をその予測に従う方向へ向かわせる ry 話し言葉 ry 、次にどんな音が、単語が ry 予測により、欠落したデータを埋め合わせ ry あいまいな音 ry 予測していることに基づいてその音を解釈 ry 、ノイズ ry 推論 ry
ry ニューロサイエンスの用語を使用する。セル22、シナプス23、 シナプス候補24、樹状突起セグメント25、カラム26などの用語 ry 。学習アルゴリズムは理論上の必要に応じてニューロサイエンスの細部に照らし ry 。しかし ry 性能の問題 ry 働きを理解したと感じたときには処理速度を向上させる別の方法 ry 、生物学的な詳細に厳格にこだわるのではなく、同じ結果が得られさえすれば ry ニューロサイエンスの用語 ry としばしば違う ry 。付録 ry HTM 学習アルゴリズムとニューロ生物学的に等価 ry 相違点・類似点 ry
セル状態 ry セルは3つの出力状態 ry 。フィード・フォワード入力によりアクティブな状態、 横方向の入力によりアクティブな状態(これは予測を表す)、アクティブでない状態である。 最初の出力状態はニューロンのアクション状態による短時間のはげしい出力27に相当する。 2つ目の出力状態はもっとゆっくりとした、安定した出力28に相当
22 cell 23 synapse 24 potential synapse 25 dendrite segment 26 column 27 a short burst of action potentials in a neuron 0597yamaguti~貸2016/12/17(土) 01:24:35.33ID:6O1Nu3vi >502 : yamaguti~kasi 2016/12/16(金) 12:12:06.60 ID:2MPdD9+O > 価値貯蔵システム = 記憶システム > ネイティブ記憶システム = ネイティブマスターアルゴリズム
する。 ry これら2つのアクティブ状態以上の詳細なモデル化の必要性はない ry 個々のアクション状態の強さの程度、アクティビティの発生頻度を表すスカラー量 などはモデル化する必要性を見いだせない。分散表現の利用は、 セルのアクティビティの程度を表すスカラー量をモデル化することを凌駕 ry
樹状突起セグメント HTM セルは比較的リアルな( ry 複雑な)樹状突起モデルを持つ。各 HTM セルは理論的に 一つの主要樹状突起セグメント29と 10~20 個の末梢樹状突起セグメント30を持つ。 主要樹状突起セグメントはフィード・フォワード入力 ry 末梢樹状突起セグメントは周辺のセルからの横方向の入力 ry 抑制セルは同じカラム中の全てのセルが 類似のフィード・フォワード入力に対して応答するように強制する。 単純化のため、各セルごとの主要樹状突起セグメントを取り除き、 同じカラム中のすべてのセルで共有する一つの主要樹状突起セグメントで置き換えた。 空間プーリング関数(後述)はカラム単位で、共有の樹状突起セグメントに対して作用する。 時間プーリング関数はカラム中の個々のセル単位で、末梢樹状突起セグメントに対 ry 。生物学的にはカラムに接続するような樹状突起セグメントは存在しない ry この単純化は同等 ry 06026012016/12/20(火) 23:57:21.05ID:ymkk5AtR シナプス ry 二値のウェイトを持つ。生物学上のシナプスは可変値のウェイト ry 確率的・不安定 ry 生体ニューロンはシナプスのウェイト値の正確な値に依存しているはずがない ry 。HTM の分散表現及び我々の樹状突起の計算モデルを利用すれば、 HTM シナプスに二値のウェイトを割り当てても何ら悪影響はないはずである。 シナプスの形成及び切断をモデル化 ry 2つの追加 ry ニューロサイエンスから援用した。 一つ目は、シナプス候補の概念である。これは樹状突起セグメントに十分近い位置を通る すべての軸索を表し、シナプスを形成する可能性があるものである。 二つ目は、永続値である。これは各シナプス候補に割り当てられたスカラー値である。 ry 軸索と樹状突起の間の接続の度合 ry 度合は生物学的には、完全に分離した状態から、 接続はしていないがシナプスを形成し始めた状態、最小限にシナプスが接続した状態、 大きく完全にシナプスが接続された状態に至るまでの範囲を取る。シナプスの
> ry 係数が0になる部分をできるだけ増 ry 計算を簡略化 ry > ─重みづけに使う係数が0になるところを増やして計算をできるだけ簡略化 ry > ry データの特徴を分析して、その枝の部分でも重要な枝 ry 決め打ちで残します。 > ─これは人が残すのでしょうか? > 現時点では人が枝を選別しています。枝を大幅に削減しても性能が落ちない事を理論的に証明 ry > 数字がたくさんあるものは「密な行列」 ry 、従来のディープラーニングと一緒。 > そこで値をほとんど持たない「疎な行列」をどう構成 ry > ─その太い幹っていうのを見切るところがすごく難しそうです。 ry 、どれだけ残して、どれだけ切 ry > ry 、例えば入力のデータに対して主成分となり得るような重要なデータの個数がある程度限定 ry > 、情報を欠損させないで中間層に伝搬させる事は可能 ry 証明 ry 1/30に削減しても同様の効果 ry > ─これはこのデータだからという事はないのでしょうか? > ry 制約条件はありません。 > ─人の顔の認識などデータが複雑だと難しいということはないのでしょうか? > ry 、さっきのガンマに依存しないっていうのは実は驚異的 ry
の疎表現は、抑制の後でどのカラムがアクティブでどれが非ア ry 。例え入力ビットのうちアクティブなビットの数が大幅に変化した場合であっても、 相対的に一定の割合のカラムがアクティブになるように抑制関数が定義される。
図 2-1 カラムとセルからなる HTM リージョンの例。リージョンの一部分のみ ry 。各カラムは入力のユニークな部分集合によるアクティベーションを受け取る。 最も強いアクティベーションを受けたカラムが他の弱いアクティベーションを抑制する。 結果は入力の疎分散表現である。(アクティブなカラムは灰色で示した)
ry ほんの少しの入力ビットが変化したなら、 いくつかのカラムでは少し多く又は少し少ない入力ビットがオン状態になるが、 アクティブなカラムの集合はあまり大幅に変化しないだろう。 よって似た入力パターン(アクティブなビットの共通部分が非常に多いもの)からは アクティブなカラムの比較的安定した集合に対応付けられる。 コード化がどのくらい安定 ry 、各カラムがどの入力に接続しているかに大きく依存 ry この接続関係は、後述する方法で学習する。 これらのすべてのステップ(入力の部分集合から各カラムへの接続関係を学習し、 各カラムへの入力レベルを決定し、アクティブなカラムの疎な集合をえらぶために抑制 ry ) を空間プーリングと呼ぶ。 ry 空間的に類似(アクティブなビットの共通部分が多い)の パターンがプールされる(それらが共通の表現に互いにグループ化される)ことを意味する。 06166152017/01/03(火) 02:58:43.04ID:igW+0jZp Page 28
2) 以前の入力の文脈に基づいて、入力の表現を作成する リージョンで行われる次の機能は、入力をカラムで表現したものを、 過去からの状態ないし文脈を含む新しい表現に変換 ry 。新しい表現は各カラムの一部のセル、普通は1カラムにつき1つのセルを アクティブにすることで得られる(図 2-2)。
「I ate a pear」と「I have eight pears」31の二つの話し言葉を聞く場合 ry 「ate」と「eight」は ry 発音が同じ ry 同じ反応をするニューロンが脳内のどこか ry また一方、 ry 異なる文脈にあると反応するニューロンが脳内の他のどこか ry 。「ate」という音に対する表現は「I ate」 ry 「I have eight」 ry 異なる ry 。 「I ate a pear」と「I have eight pears」の二つの文を記憶したと想像してみよう。 「I ate…」 ry 「I have eight…」 ry 異なる予測 ry よって ry 異なる内部表現 ry
ある入力を異なる文脈では異なるコード変換をするというこの原理は、 認知とふるまいの普遍的な特徴であり、HTM リージョンの最も重要な機能の一つ ry 06176162017/01/03(火) 03:06:42.48ID:igW+0jZp ry カラムは複数のセルからなっている。 同じカラムのすべてのセルは同じフィード・フォワード入力を受け取る。 ry 。アクティブな各カラムごとに、どのセルをアクティブ ry 選択するかによって、 完全に同じ入力に対して異なる文脈では異なる表現をすることができる。 例 ry 。各カラムは 4 つのセルからなり、各入力は 100 個のアクティブなカラムで表現 ry 。カラムの中で一つのセルだけが一度にアクティブであるとすると、 完全に同じ入力に対して 4100 通り ry 。同じ入力は常に同じ組み合わせの 100 個のカラムがアクティブになるが、 文脈が異なればカラム中の異なるセルがアク ry 非常に大きな数の文脈を表現 ry 、これらの異なる表現はどのくらいユニーク ry ? 4100 個の可能なパターンのうちからランダムに選択した 2 個は、 ほとんどの場合、約 25 個のセルが重複 ry よって同じ入力を異なる文脈で表した 2 つの表現は、 約 25 個のセルが共通で 75 個のセルが異なっており、容易に区別 ry
HTM リージョンの一般的な規則 ry カラムがアクティブ ry 、そのカラム中のすべてのセルを見る。 もしそのカラム中の一つ又はそれ以上のセルが既に予測状態であれば、 それらのセルだけがアクティブになる。もしそのカラム
中のすべてのセルが予測状態でないならば、すべてのセルがアクティブになる。 ry :ある入力パターンが期待されるなら、システムは予測状態のセルだけをアクティブ にすることで期待通りであることを確認する。その入力パターンが期待と違うなら、 システムはカラム中のすべてのセルをアクティブにすることで、 「予期しない入力が発生したのであらゆる解釈が有りうる」ということを表す。
もし以前の状態が何もないなら、従って文脈も予測もないなら、 ry になるときは各カラム内のすべてのセルがアクティブになる。 ry 歌の最初の音を聞いたときと似ている。 文脈がなければ、 ry 予測できない:すべての選択肢が有効である。 以前の状態があるが入力が予期したものと合致しないときは、 アクティブなカラムのすべてのセルがアクティブ ry 。この決定はカラムごとに 行われるので、予測 ry は「オール・オア・ナッシング」32ではない。
図 2-2 カラムの一部のセルをアクティブにすることで、 HTM リージョンは同じ入力の多くの異なる文脈を表現 ry 。カラムは予測状態のセルだけをアクティブにする。 予測状態のセルがないカラムでは、カラム中のすべてのセルをアク ry 。図は、あるカラムでは一つのセルだけがアク ry 、あるカラムではすべてのセルが ry
ry HTM セルは3つの状態を取る。 セルがフィード・フォワード入力によってアク ry 単に「アクティブ」の用語 ry
3) 以前の入力の文脈に基づいて、現在の入力からの予測をするリージョンの ry 予測はステップ 2)で作成した、すべての以前の入力からの文脈を含む表現に基づ ry
リージョンが予測をするときは、将来のフィード・フォワード入力によって アクティブになると考えられるすべてのセルをアクティブ(予測状態)にする。 リージョンの表現は疎であるので、同時に複数の予測がなされ得る。 例えばカラムのうちの 2%が入力によってアクティブになるとすると、 カラムの 20%が予測状態のセルとなることで10 個の異なる予測がなされ得る。 ry 40% ry 20 個 ry 。各カラムが 4 個のセルからなり、一度に一つだけがアクティブ になるとすれば、セル全体の 10%が予測状態 ry
今後、疎分散表現の章が追加されれば、異なる予測が混じり合っても、 リージョンは特定の入力が予測されたのかそうでないのかを高い確信 ry
リージョンはどうやって予測 ry ? 入力パターンが時間と共に変化するとき、 カラムとセルの異なる組み合わせが順次アクティブになる。 あるセルがアクティブになると、周囲のセルのうちすぐ直前にアクティブだったセルの 部分集合への接続を形成する。これらの接続は、そのアプリ ry で必要とされる学習速度 に応じて早く形成されたりゆっくり ry 調整できる。 その後、すべてのセルはこれらの接続を見て、 どのセルが同時にアクティブになるかを探さなくてはならない。 もし接続がアクティブになったら、 セルはそれ自身が間もなくアクティブになることを予測することができ、予測状態に入る。 よってある組み合わせのセルがフィード・フォワード入力によってアクティブになると、 ひき続いて起こると考えられる他の組み合わせのセルが予測状態になる。 ry 歌を聞いていて次の音を予測 ry 瞬間と同様 ry
図 2-3 ry リージョンのいくつかのセルがフィード・フォワード入力によってアク ry (薄い灰色で示した)。他のあるセルは、アクティブなセルからの横方向の入力を 受け取って予測状態になる(濃い灰色で示した)。
まとめると、新しい入力が到着すると、アクティブなカラムの疎な部分集合が選択される。 各カラムの一つ又はそれ以上のセルがアクティブになり、これはまた同じリージョン内 のセル間の接続の学習内容に応じて他のセルを予測状態にする。 リージョン内の接続によってアクティブになったセルは、 ry 予測を表す。 次のフィード・フォワード入力が到着すると、 他のアクティブなカラムの疎な組み合わせが選択される。 新たにアクティブになったカラムが予期したものでないとき、 つまりどのセルも ry 予測しなかったとき、カラム中のすべてのセルをアクティブ ry 。新たにアクティブになったカラムが ry 予測状態のセルを持つなら、 それらのセルだけがアクティブになる。リージョンの出力はリージョン内のすべてのセル のアクティブ状態であり、フィード・フォワード入力によってアクティブになったセルと、 予測状態のためアクティブになったセルとからなる。
既に述べ ry HTM リージョンの予測は将来のいくつかのステップに及ぶことも ry ry メロディの次の音を予測するだけではなく、例えば次の 4 つの音 ry 。 ry 出力(リージョン内のアクティブ状態のセルと予測状態のセルの和集合) は入力よりもゆっくりと変化する。 リージョンがメロディの次の 4 つの音を予測 ry 。メロディを文字 A, B, C, D, E, F, G のシーケンスで表現する。最初の 2 音を聞いた後、リージョン 06246232017/01/11(水) 21:00:08.87ID:Tu17jTh4>>623
はシーケンスを理解し、予測 ry C, D, E, F を予測する。 B のセル33は既にアクティブであるから B, C, D, E, F がそれぞれ 2 つのアクティブな状態のどちらかになる。 ry 次の音 C ry アクティブ状態のセルと予測状態のセルの集合は C, D, E, F, G を表す。 入力パターンは B から C へとまったく違うものに変化したが、20%のセルだけが変化 ry
ry の出力はリージョン内のすべてのセルのアクティブ状態を示すベクトル で表されるので、この例の出力では入力に比べて 5 倍安定 ry 階層構造を上に登るに従って時間的な安定性が増加 ry 表現に文脈を追加して予測を行う 2 つのステップを「時間プーリング」 ry シーケンスに対してゆっくりと変化する出力を生成することで、 時間と共に順に現れる異なるパターンを「プールする」34。 ry 別のレベルで詳細化 ry 空間プーリングと時間プーリングで共通の概念から始 ry
共通概念
空間 ry と時間プーリングの学習は似て ry 、セル間の接続関係、あるいはシナプス の形成を含む。 時間プーリングは同じリージョン内のセル間の接続を学習する。 空間プーリングは入力ビットとカラムとのフィード・フォワード接続を学習する。
二値ウェイト HTM のシナプスは 0 又は 1 ry 。多くの他のニューラルネットワークモデルでは 0 から 1 の範囲で変化するスカラー値のウェイトを用いるのと異な ry