【RaspberryPi】1ボードPCを語るスレ13【Pine64】

813774ワット発電中さん2018/11/09(金) 10:10:11.51ID:zINoe3jQ
どの程度遅いのか気に成ったので、掛け算を10億回するコード書いて確認してみたら以下でした。
ラズパイ3B、gcc -O0 -march=cortex-a53 -mfpu=neon、全て単精度。

・シングルスレッドでa*=bを、forループで10億回 -> 12.6秒、約80メガFLOPS

・4スレッドでa*=bを、forループで10/4億回 -> 3.1秒、約320メガFLOPS

・4スレッドで128bitベクトルレジスタでa*=bを4個同時つづつを、forループで10/16億回 -> 0.09秒、約11000メガFLOPS(11GFLOPS)

Pen3の1GHzで単精度SSEの限界は4GFLOPSだから、ラズパイ3Bなかなかやりますね。

新着レスの表示
レスを投稿する