そろそろメモリ中心の構造にしないとな
バスで大容量メモリに演算機が繋がってる構造じゃなく、
メモリチップ毎にそのメモリのデータを使う演算機を全部付ける
もちろんそのメモリチップ外のアドレスへのアクセスは必要だが、
その外部メモリアクセスを最小化する方向で演算を分散させて行かないとメモリ帯域の問題が解消できん
以前どこかで研究してたようだがどうなったのかねえ