【Cortex-】 やっぱARMっしょ 11 【AxRxMx】 [無断転載禁止]©2ch.net
レス数が950を超えています。1000を超えると書き込みができなくなります。
ARMデバイス、ARMボードについて組込系ARM全般のスレ
時代は「やっぱARMっしょ」
省電力ニーズの高まりを背景に海外チップベンダーはもとより国内勢も参戦
ホビーとしてのマイコンからスマートデバイス用プロセッサまで
ARMコアを持つチップやボードのラインナップは今まさに百花繚乱
【前スレ】
【Cortex-】 やっぱARMっしょ 10 【AxRxMx】
http://rio2016.2ch.net/test/read.cgi/denki/1444051881/ ARMとx86の命令を比べれば
ARMのチープさがよくわかるよ
IPCが高くても性能は糞 >>851-852
Execute Engineでの比較なんだけど?
命令セットアーキテクチャが関係してくるのはデコーダのレイヤーでしょ
命令を解釈したあとアウトオブオーダー処理して実際にExecute Unitに入れて実行する部分が、
・Skylake
6マイクロ命令ディスパッチ、8マイクロ命令実行、4整数ALU、2浮動小数点ALU(整数ALUとポート共有)、3アドレス生成ユニット(+StoreData)
・Zen2
6マイクロ命令ディスパッチ、11マイクロ命令実行、4整数ALU、4浮動小数点ALU、3アドレス生成ユニット
・Exynos M4
6マイクロ命令ディスパッチ、12マイクロ命令実行、4整数ALU、3浮動小数点ALU、3アドレス生成ユニット(+StoreData)、1分岐処理
Execute EngineレベルではSkylakeよりExynos M4が上だから、IPCも実際の処理性能も上でしょ? >>853
1命令あたりの処理量が違う
Execute Unitの >>854
整数演算ALUの性能は同じだよ
浮動小数点ユニットはあいまいだけど
要するにSkylakeは整数演算と浮動小数点演算の処理能力は1サイクルで両方合わせて
最大同時4実行だけど、Zen2は最大整数演算4+浮動小数点演算4=同時8実行で、
Exynos M4は最大整数演算4+浮動小数点演算3=同時7実行になるわけ
命令セットが何であれ1サイクルの処理能力はSkylakeよりExynos M4のほうが上でしょ?
あとSkylakeは6マイクロ命令ディスパッチ、8マイクロ命令実行、4整数ALU、2浮動小数点ALU
(整数ALUとポート共有)、3アドレス生成ユニット(+StoreData)に加えて2分岐処理があるね >>855
同じじゃないよ
命令知ってていってんの? >>856
命令は関係ない
ALUだよ?算術演算ユニット
ハードウェア回路レベルの話 >>857
intelでいうところのuOP命令
これの処理量が違うの ただのレジスタ同士のスカラ整数加算みたいな単純なのでも
レイテンシやスループットが違ったりする
1命令で出来ることも違う てかなんでIntelだけ古いSkylakeなんだ?Exynos M4は2018年からだしZen2は2019年からだ
比較するならIce Lakeあたりじゃないの。AGUとStoreDataが+1されて10ポートになっているし x86は
32bit小数の積和が16個出来たり
整数の積和が16個出来たり
ビット数カウントが出来たり
任意の3オペランド論理演算が出来たり >>852
> IPCが高くても性能は糞
とは言えないみたいよ、マジで
AMD Ryzen 7 3700X vs Apple A13 Bionic
https://gadgetversus.com/processor/amd-ryzen-7-3700x-vs-apple-a13-bionic/
Zen2 A13
Base frequency 3.6 GHz 1.8 GHz
Turbo frequency 4.4 GHz 2.7 GHz
Geekbench 5
single core 1.251 1.331
multi-core 7.897 3.364
これだと比較出来ないからGHz辺りで見ると、
Geekbench 5 / Base frequency
single core 0.348 0.739
multi-core 2.194 1.869
シングル性能は倍。
マルチスレディング(16vs6)の力技でZen2でやっと上回ってるw >>858>>861
ALUの話をしているんだけどCPUの構造全くわかっていないのかな?
FPGAとかでCPUを実際に作ったことある?
まあ自分も担当したのはCPUシミュレータとラベル付きアセンブラと整数演算で浮動小数点
演算するルーチンの実装だけど、ALUぐらいなら自分でもVHDLで実装できるぞ
それと命令セットについても何か勘違いしているね
実際の命令セット見てみたら
ttps://software.intel.com/content/www/us/en/develop/download/intel-64-and-ia-32-architectures-sdm-combined-volumes-1-2a-2b-2c-2d-3a-3b-3c-3d-and-4.html
ttps://developer.arm.com/docs/ddi0487/latest >>862
その数字は実態を反映しているのか?マルチコアの値をコア数で割るとA13はボロボロじゃないか >>863
同じ処理なら
アーキテクチャによらずに同じ内部命令になって
それらの内部命令はスループットもレイテンシも全て同じだって?
バカ? >>864
A13は高性能コア2と高効率コア4だから高効率コア4の性能がそれほどでもないだけかと
>>865
もう一度言うけどALUって何かわかる?レジスタファイルってわかる?
組み合わせ回路と順序回路の違いわかる?
回路レベルの話をしているの
何もわかっていない的はずれなツッコミやめて >>860
同じレベルのブロック図があれば使ったんだけどここには載っていない
ttps://en.wikichip.org/wiki/intel/microarchitectures/ice_lake_(client)
どこかにある? 加減論理演算1bitシフトしか出来ないALUから
乗除算バレルシフタビットカウントが出来るALUまで 積和やなど複数の演算を1回で出来るのが普通なのに
全部同じ? >>866
> A13は高性能コア2と高効率コア4だから
そういやそうだな。
えっ、2個でここまで肉迫?とんでもない性能だな 過疎スレが突然盛り上がって何事かと思ったら…
appleは宗教だから、中身にハムスターが車輪回して動かしてたって買うさ >>849
> > Zen 2は4命令デコードだが、実行パイプは11パイプだ。雑に言えば、Arm系の6-7命令デコードCPUは、
> > 実行パイプで比較するならx86/x64系CPUの4-5命令デコードクラスだと言えそうだ。
> ここが意味不明なんだけど
ARMが下と言っている訳ではなく、「大雑把に言えば同じ」と言っているかと。
その直前に「x86/x64系のハイエンドCPUは、4から5命令デコード/サイクル」とx86が下だと誤解を招きかねない事を書いているので、その補足説明ですね。 デコード/サイクル
を比べてもそれだけじゃなんの意味もない
命令あたりの処理量も違うし
uOPキャッシュもある 広く使われているプロセッサを設計しているメーカーが
デコーダの能力と実行パイプの本数を大きく誤るとは思えない
>>862は何かボトルネックが存在しそう >>876
実際の使い方考えたら、単純な演算速度よりも、外部バスの速度が効いてくる。 先日知人と話してて過去にLPC1114を使ってた話から
今どうなってんのかと秋月見たらDIPはもうディスコンなのな
TSSOPならまだあるみたいだけど もともとが気まぐれなんだろうね
絶対に数出ないもん >>888
XC32の対応デバイスリストには、既に有ったと思う。 >>892
PIC32Cとかって名前になってた気がする 【経済】 アームを3兆4000億円超で買収検討か 米半導体エヌビディア、ソフトバンクグループから [影のたけし軍団★]
http://asahi.5ch.net/test/read.cgi/newsplus/1596249352/ ハゲは結局ARM買収して何したかったんだか?
もうこの期に及んでは将来ビジョンなど語る余裕もなく資金繰りのために
売却するしかないだろな
今のビデオカードにCPUコア埋め込むとかなんかメリットある? >>866
>もう一度言うけどALUって何かわかる?レジスタファイルってわかる?
>組み合わせ回路と順序回路の違いわかる?
さすがに
ここ電電板だしww
pc板見てたのかと確認したわ
pc板のCPU関連スレも見てるんで。 誰も見てないからココに愚痴を書いておく
この前、旧atmelのSAM3S等用の基板にSAM4SD16載ってけてみたんだ
でUSBでSAM-BA動くかな?と思って繋げたら
ウンともスンとも言わない
と言うか不明なデバイスと出る
調べたら、SAM4SはUSBでSAM-BAダメとか言うエラッタがある
仕方ないからシリアルで繋げても「こんなチップ知らん」
結局、SAM4SD系はSAM4SD32だけしか標準でSAM-BA対応しないらしい… Arm、プロセッサ内でOSを動作可能にした「Cortex-R82」
〜64bit化されたArmv8-Rのストレージコントローラ
https://pc.watch.impress.co.jp/docs/news/1274842.html
> Cortex-R82は、Cortex-R8の後継となるリアルタイムプロセッサで、Armv8-Rアーキテクチャを採用。
> Cortex-Rファミリとしては初の64bitをサポートする。
> 最大8コアで設計でき、Cortex-R8と比較して性能は最大2倍に向上した。
> また、最大1TBのDRAMにアクセスできるようになっている。
>
> また、SIMD(Single Instruction, Multiple Data)演算のための命令「Neon」もオプションで利用でき、
> 処理をさらに高速化することも可能。
> データ保護を行なうArm TrustZone技術も用意されている。 >>905
ニュース見たけど、リアルタイム処理するのに64bitとかMMUって必要なんか?
演算時間に32bitと64bitは差が無いし、浮動小数点演算に関係無いし、固定小数点演算にそこまで精度必要無いし。
誰か解説してくんない? >>906
主にストレージデバイス用だよ
Windowsでも32bit Windowsより64bit Windowsの方がディスクアクセス速いし
HDDやSSDのコントローラならHDD、SSDの容量的に64bit演算を多用するからね
>Armは4日、組み込み向けプロセッサ「Cortex-R82」を発表した。
>おもに同社が約85%のシェアを持つとするHDDやSSDといったストレージデバイスのコントローラなどとして利用される。 >>907
えっ? 今さら? もう遅くね?
WD、2019年からNAND/HDDのコントローラを順次RISC-Vベースに移行
https://pc.watch.impress.co.jp/docs/news/1128863.html >リアルタイム処理するのに64bitとかMMUって必要なんか?
リアルタイム云々ではなくてOS乗せる前提というなら必要で間違ってはいない
メモリ保護管理機能がないと1つのプロセスが暴走してOS全体が壊れる
OSが動くとDDR4などRAM上で動くので小規模組み込みのフラッシュのみという訳には
いかないからな …一応、MMU載ってない奴でも、メモリ保護の為のMPUは載ってるから… >>910
なに言ってんだか。
一つでもプロセスが暴走したら、組込みシステムとしては致命的。
OS保護しても意味がない 日本がARMなど買収しても意味は無く、もてあますだけだから早く売却してしまった
ほうがよいだろうとは思うね。買収額も高すぎ。
NVIDIAはソフトバンクよりもテクノロジー企業なのでNVIDIAであればARMをさらに
成長させることが可能だろう。 ARMは薄利多売で普及させた企業だからNvidiaとは真逆の経営方針と言える。 ソフトバンクは投資会社のような存在だし通信会社は基地局や端末ハードは外注で
アンドロイドのOS開発も一切関わってない。
ARMの命令セットや内部設計に助言できるほど今の通信会社はノウハウ持ってない。
テクノロジー企業のARMは同じテクノロジー企業のNVIDIAと近い。
投資会社とテクノロジー企業ほど乖離してないからNVIDIAはうまくやると思うぞ。 >>919
IntelのAltera買収はうまくいきましたか?Xilinx一色になっているように見えるが Cortex M系で、メモリが16MB程度載っている製品ってありますか?Spresenseよりリッチなことをしたいのですがなかなか探せてなくて。 >>921
DigiKeyで条件検索すればすぐ判るのでは? >>921
16MBものSRAMを内蔵しているcortex-mはないだろ
外付けSDRAMすれば良いんじゃないか >>926
ありがとう。あるんだね。このぐらいの消費電力ならA系でもありなので助かります! >>927
そもそも、そんな大量のRAM何に使うん? >>929
なんちゅうか、もっと具体的になにやりたいん?って事 >>930
遅くてもいいのですが、1024x1024とか2048x2048の画像の簡単な処理(座標変換など)をしてフレームバッファに書きたいのですよね。今はグレースケール2bppぐらいに抑えてなんとかしてますが、もうちょっとbpp欲しいです。 >>930
5chにはコミュ力がない奴が普通だからな
探している物はcortex-Mで16MB,でも(消費電力あえば?)AでもOKなんです。
実はARMでもなくてもOKだったり。
エスパー、高脳でないとほんとに探しているものは分からないと >>931
そう言うのだったらARMとは全然ちがうけど、
Jetson NANOとかでフルパワーで動かすと楽勝で処理出来そう >>931
>>926は情報少なそうだね
Raspberry Pi ZeroやRaspberry Pi Zero Wはどうなの?
消費電力はこんなものみたいだよ
https://www.usagi1975.com/052520180823/ >>932
ワンチップで16MBのSRAM持ってるマイコンはないだろうね
外付けなら16MBも512MBも大して消費電力変わらないのでは? >>936
それなら QSPI SRAMがより良くね? >>939
あれは今のところ一回こっきり。性能向上版はいつになるやら >>941
リナウス トパーズ?氏も欲しいと言ってるみたいやね、Linuxが動くならw 勘違いしている人を少なからず見かけるが
A64FXはSVEが速いのであってARMv8は特段速くないだろ
出回っているARMv8コードで○TFLOPS出るわけではない >>943
A64FXはArmの皮を被ったSPARCだと聞いた事があるなぁ。
シングルスレッドの処理能力が全体に効くとも聞くし、そこそこ強化されてんじゃね?知らんけど >>944
そりゃ新しいぶん先代よりは強化されているだろうが
ARM CPUとして使った場合、競合CPUと比べて
ぶっちぎりで速いわけじゃなくね
どうせベクトル化できるコードを用意して専用コンパイラで
コンパイルしなきゃいけないんだしARMである必然性もない そうは言っても
今まで、arm命令セットでさ
デスクトップ以上の発熱とか許容するCPUにしたてた会社が少なすぎてw
比較出来る対象が(ry AMD64なりPOWERなりと比べればよくね
HPCなんて計算速度が速ければ命令セットなんて何でも良い世界なんだし >>945
そもそもスバコン用のプロセッサを普通のプロセッサと比べて意味あるのかな?
I/Oやメモリアクセスはメチャ強力だから、もし整数演算が悪くても見えないんじゃね?知らんけど
ちなみにx86と単体で比較すると1.2倍位。極端に差は無いね。
https://news.mynavi.jp/photo/article/20191206-933874/images/014l.jpg >>948
比べる意味はほとんどないと思うよ
でも富岳をもってARMスゲー言う人をしばしば見かけるような
もっといえばA64FXはTSMC 7nmであり日本製ではない
あれで「日の丸半導体の復活」などと謳うのは恥ずかしい・・・
NECのVEもTSMC 14nmだったはずで日本に最先端のプロセッサを
製造できる能力はない
そのグラフだけどx86はIntelにしろAMDにしろメモリはDDR系だろう
A64FXはHBM2搭載で1.x倍だとコスパは相当良くないとも言える
やはりSVEをブン回して初めて意味のあるチップかと >>949
実際Armは凄いんでないかい。
AppleのM1チップはx86を凌駕してるっぽいし レス数が950を超えています。1000を超えると書き込みができなくなります。