必要 メモリアクセス量を減 に潜在的に有用であり得る別 法は、 行列を圧縮 。
ただし、HPCアプリ でのデータ圧縮の使用に関する多 研究論文があるにもかかわらず、SpMV乗算へのデータ圧縮の適用に関する研究はほとんどない
? ry するためには、1つの行列要素あたり ry 。
考えられる理由の 1 つは、実際の高速化を達成 際の、行列要素 1 つあたりの浮動小数点演算の数が2つだけなので、データ圧縮解除アルゴリズムは非常に効率的でなければならないこと
? 解凍ア が2、3以上の命令を必要 ry それは総費用のかなり ry 。
ほんの幾つかでなく更なる命令をもしも解凍アルゴリズムが必要 ならば、 トータルコストのかなりの増加を引き起
? ry に、一般に、解凍ア はいくつかのテーブル ry 操作、すなわち現代 ry 特に効率的ではない間接的なメモリアクセスを必要 ry 。
さらに、現代のマイクロプロセッサにとって特に非効率的な、テーブルルックアップ操作即ち間接メモリアクセスをいくつか、一般に解凍ア は必要とする。
一方、システムのハードウェアB / F数が極端に小 場合は、データの圧縮/解凍 で、SpMVの乗算でパフォーマンスが大幅に向上 可能性 。
本稿では、HPCGベンチマーク[ 4 ] 、 [ 5 ]のSpMV部分におけるZettaScaler-1.5スーパーコンピュータ[ 7 ]の性能について、データの圧縮/解凍を使用した場合と しない場合について報告 。
ZettaScaler(以前はExaScalerと呼ばれ )システムは、第一世代のPEZY-SC 1024コアプロセッサチップをベースにしています
2014年11月のTOP500リストに掲載され、Green500 2位
2015年6月のGreen500 、3つのExaScalerシステムが上位3つ 占めました。
? ry されたシステムは ry の数を大幅 ry 。
#1 のシステムは、7 Gflops / W を達成し、2014年11月の #1システム を大幅に上回りました。
2016年6月現在、Green500 では依然としてナンバー1 維持 。
(強いAI)技術的特異点/シンギュラリティ177
■ このスレッドは過去ログ倉庫に格納されています
24yamaguti
2019/10/30(水) 06:22:34.99ID:mUIxiXRX■ このスレッドは過去ログ倉庫に格納されています
