【Cortex-】 やっぱARMっしょ 11 【AxRxMx】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
ARMデバイス、ARMボードについて組込系ARM全般のスレ
時代は「やっぱARMっしょ」
省電力ニーズの高まりを背景に海外チップベンダーはもとより国内勢も参戦
ホビーとしてのマイコンからスマートデバイス用プロセッサまで
ARMコアを持つチップやボードのラインナップは今まさに百花繚乱
【前スレ】
【Cortex-】 やっぱARMっしょ 10 【AxRxMx】
http://rio2016.2ch.net/test/read.cgi/denki/1444051881/ 極端なローパワーを求められない用途ではまだまだAMD64が強い 最近のChromebookにはArmモデルもあるのか。知らんかった。
Chromebookか、どうなんだろう。 ARMマイコンについてなんですが
PICやAVRマイコンはワンチップに極力機能を納める方向で進化してて
CortexのようなARM系マイコン、RISC系マイコンはワンチップに納めようとせず周辺パーツと連携するためにバスをはやす方向で進化してるってイメージはあっているでしょうか? >>742
はぁ?なぜそんな認識?
今はSoC化でなんでもワンチップにする方向。Armもね。 そこそこの速度で周辺を拡張ってなら
SPIやQuadSPI十分だろ?的な… >>741
Androidベースなら普通にARMになるだろ。 >>745
最近ときどきChromebookのテレビCM見るけどARMベースだったんだ!
Intelマシンと比べてパフォーマンスはどうなんだろうね?
やっぱりグラフィック速度とかはIntel系が強いかな? >>745
スレチだが、Chromebook OSとAndroid OSとは別物。
最近のChromebook OSは、LinuxアプリとAndroidアプリを実行出来るんだってさ。 >>747
LinuxもAndroidも両方実行できるChromebookって、何気に凄そうに思えてきたんだけど。。 >>748
俺も1台あってもいいかなとは思うが、何に使うかで逡巡してる。 普通に居間でネットサーフィンするのに使ってる。
キーボードあるとメールも検索も早いし。
ソファで動画見るにはタブレットのほうがいいけど。 cerelonNとかatomなネットブック系win機でyoutubeを見るとビミョーだけど
chrome bookなら >>751
欲しくなるだろ!!
投資で大損したから当分は我慢だなorz ちょっと古いpcにcloudready入れるといい感じ
androidアプリは対応してないけど >>752
このスレにも、コロナの影響で株で損した奴がいるんだ?
>>750
Chromebookでoffice関連アプリ使ってる?
スマホ用だからAndroidのofficeアプリはイマイチだよね?
Linuxで良いofficeってある? Chromebook で office なんて使わないよ。
ってか、職場で仕方なくは使うけど。
基本、アプリは入れない。ブラウザのみ。 >>754
基本的にthin clientだからな。
繋ぐ先でアプリは変わる。
ローカルには接続するソフトしか入れてないよ。
殆どブラウザで、都度javascriptのアプリ落としてきてるのが多いけど、サーバー側で動いてるのも有る。
オフィス系はgoogleappは使えるけど、そういうの使いたい時はwindowsの画面引っ張ってくることの方が多いな。 >>754
iPad、iPhone、Androidで使うExcelは、軽く触った限りはExcelだったよ。
そこそこ使えるんじゃね >>747
AndroidはLinuxベースだろ?
(Ubuntuだっけ?) >>758
カーネルはLinuxだが、ユーザーランドはオリジナル。
無論、Ubuntuではない ユーザーランドもパクりまくってたからOracleに訴えられて負けたんだろ。 >>761
ググれってw 二次ソースじゃなく一次ソース嫁や >>762
訴えられたのはJavaAPI、ユーザーランドをパクった訳ではない ARM版Windows 10搭載の2in1 PC「Yoga C630」が税込79,800円でセール
https://akiba-pc.watch.impress.co.jp/docs/wakiba/find/1244803.html
Lenovo Yoga C630 製品仕様書 81JL000DJP | レノボジャパン
https://www.lenovo.com/jp/ja/static/catalog/nb-2019-yoga_C630_web_0416
Snapdragon 850
Adreno™ 630
SIMフリー
Active Pen、Microsoft Office Home&Business 2019付属 Cortex-A53が載っているのでこのスレに
ソシオネクスト 電力効率が汎用GPUの10倍以上、量子化DNNエンジン搭載のAIチップを開発
https://monoist.atmarkit.co.jp/mn/spv/2004/08/news095.html
何に使えるかな?記事には自動運転、監視カメラ、FAとか書いてあるけどさ。
NVIDIA® Jetson Xavier™ NXと比べてどうだろう。NVIDIAは長期供給がアレなんで、エッジのキラーデバイスになったりして。
ワクテカ(死語w)だわ 5nmプロセス向け。性能が2割向上したArm「Cortex-A78」 〜新フラグシップGPU「Mali-G78」なども - PC Watch
https://pc.watch.impress.co.jp/docs/news/1254999.html >>763
一般常識としてJavaの発明はSun/OracleにあるのだしJavaを使っているのだから
何らかの費用経費の支払いが生ずるのは当然だと思うよ。
Androidで無償使用するにしてもSun/Oracleからの何らかの書面が必要になると思う。
それすらないわけだから。
なぜGoogle側が負けることが不満なのか理解できない。
もしこれが正しく履行されないならソフトウエアのビジネス自体成り立たないよ。 >>770
2ヶ月も前の話題に何を言いたいのやら。
元ネタは「ユーザーランドもパクりまくった」の間違いであって、誰も不満とは言ってない訳だが? 東芝のマイコンて聞いたことないんだが?
総合電機のなかで東芝マイコンをそもそも検討したことがない。
今マイコン出すならシリコン以上の開発デバッグ環境とサポートツール、
RTOS用意しないととても勝負にならん T芝独自マイコンならTLCS90とか900シリーズがあるだろ!! AKI80のZ80が東芝製だったな。それ以外は思い出せんw その時代のワンチップはまだマスクROMベースが主流で
個人で使うなんて無いし…
ましてやまだ開発環境が有償だった時代じゃ
メーカー独自CPUなんて、それこそ特殊な事情がなけりゃとても… >>777
大口専任で小口にはそっぽを向き、それでマインドシェアが低いとか? >>780
NECには「使った事は無いが、名前は聞いた事がある」って石が多いよ。78なんとかとか、V860なんとかとかね。
説明しろと言われたらさっぱり答えられんがw TMPZ84Cだね バスが出ててROM外付けだからROMライタで焼いてソケットに
挿して使っていた 今やRL78も普通に買えるが前身の78K0とか何処に売っているんだよ状態だった
IDEもICEも良いお値段していたし趣味で使うとかあり得なかった
78K0のIDEに付いているシミュレータは一部のペリフェラルもサポートしていて結構優秀だったな 此処はArmスレ
Z80も78KもRL78もスレチ スレチスレチ言う人に限ってスレにふさわしい話題を投稿しない法則 ほんじゃま、スレに相応しい話題w
RISCの生い立ちからRISC-Vまでの遠い道のり:
ARMの誕生 〜Sinclair、BBCからNewton、Symbianへ〜
https://www.itmedia.co.jp/news/spv/2006/08/news058.html この記事でこんなこと言ってるけどこれどうなの?とかあるならまだしも単にリンク貼るだけなんて嵐と変わらないw >>788
我が儘な奴だw
ARM躍進はスマホ(正しくは携帯)だった!の認識通りて特にコメントは無い >>787
良くしらんかったけど ARM7 と ARM7TDMI って世代の違う別物だったのね 【国際】イギリスの半導体設計大手アームが中国合弁会社のCEO解任発表 合弁会社側は否定 説明食い違い、内部対立か [さかい★]
http://asahi.5ch.net/test/read.cgi/newsplus/1591829366/ x86オワコン、これからはARMの時代と言われて大分経つが
未だにARMはタブレット止まり。数は多いから儲かってはいるだろうが
PCでもクリエイティブやエンジニアリング分野、サーバー等は
高性能競争で火花を散らすIntel vs AMDに割って入れそうな雰囲気は全くない スパコンってFUJITSU A64FXのことを言っているのかな。あれって1コア当たりの性能は大したことなくね?
多コアでも高効率を維持出来る処理じゃないと高スループットを出せないように見える
ベクトル系の処理だとNEC SX-Aurora TSUBASAに勝てる気がしない Macが2025までにARMへ完全移行するって正式発表を今月中にするって噂がある >>794
割って入る雰囲気がない?本当かそれ?
Amazon設計のARMプロセッサ「Graviton 2」の性能はIntel製CPUにどれほど迫っているのか?
https://gigazine.net/news/20200616-intel-vs-graviton2/ 命令セットの素養とか
浮動小数点演算系命令の新しさとか利用頻度なんかだと
どうしたってarm64が一番新しいからね!
古いコードが未だに利用されかねないx64よりは…ね! >>798
それ、汎用用途ではAMD64に勝てませんと言っているようなものでは
クラウドだとコア数勝負になるしプロセスルールで後れをとっているIntelが振るわないのは当然
てかその程度だと64コア/128スレッドの3rd EPYCに対するアドバンテージは少なそう >>800
> プロセスルールで後れをとっているIntelが振るわないのは当然
なぜそこでインテル擁護?
つうか、グラフの見方を分かってないだろ? 汎用用途はいくら性能が勝っててもなかなか採用できないよ
ソフトないんだからw >>799
内部をRISC化すれば、性能に命令セット関係ねぇ!の流れで進化して来たから、その素養説はちょっと解釈が違うと思うな。
コア数に比例して性能が増加するのは、逆にx86は消費電力的に頭打ちなるから。つまり温度上昇を許容出来なくなるから。
その原因は、x86命令のデコードに余計な電力を食われるから。
素養説も大きくは間違ってないけど、結局x86命令セットは電力効率の悪さがこの結果を招いた。 x86系のデコードは高コストと昔から言われている割にはIPCや周波数でx86を越えられるプロセッサってなくね?
ARMだってコア増やしてスループットを上げる方向だしシングルスレッドで競ったら勝負にならない すでにApple A11以降はSkylakeの倍以上のIPCがあってA14はシングル性能も完全に追い抜いているが >>804
あははは(笑)
IPCについては今まで、Arm社は本気を出して無かったからなぁ。
これからどうなるか?ってとこ
シングルスレッド処理向上で最上級の性能を得たArm「Cortex-A77」のマイクロアーキテクチャ
https://pc.watch.impress.co.jp/docs/column/kaigai/1188094.html Skylake/IceLakeのデコーダは5命令/cycle
Zen2のデコーダは4命令/cycle
Cortex-A77のデコーダは6命令/cycle
A11のIPCがSkylakeの倍以上?10命令デコードしてそれを全部計算できる?
x86の場合実際には2〜3命令/cycle程度だったと思うけどその倍でも4〜6命令もある
いくらARMのデコードが軽くたってロードストアや計算、分岐予測等のコストが軽くなる訳じゃない
トランジスタの数が合わなくね?それ何処情報だよ>>>805 >>807
> Skylake/IceLakeのデコーダは5命令/cycle
残念ながら違う
理論上の最高値が4.2で実際はもっと落ちる
Pentium Pro以降のIntel CPUはすべての命令をデコードできるComplex Decoder1基と
簡単な命令しかデコードできないSimple Decoder複数から構成されていて、Simple
Decoderは1サイクルでデコードできるけどComplex Decoderはデコードに4サイクルかかる
それにSimple Decoderでデコードできない命令が2つ以上あった場合4サイクル経って
Complex Decoderが開放されるまでデコードが止まる
SkylakeはComplex Decoder1でSimple Decoder4で実行ポートは8ポート
だからSkylakeはせいぜい3命令/サイクルぐらいでしかデコードできない
A11以降は7命令/サイクルで実行ポートが13なのでA11はSkylakeの倍以上のIPCがある >>808
一読すると正論に読めるけど、なんか違和感ある。なんだろ? >>808
これか?
https://pc.watch.impress.co.jp/docs/column/kaigai/1208397.html
AppleはCPUコアのシングルスレッド性能の向上にこだわってきた。A12の性能CPUコア「Vortex」は命令デコード幅が7-wideとされており、Arm命令セットアーキテクチャのモバイルCPUコアのなかでは飛び抜けて広い。Arm自身のCPUコアIPでは、現状はCortex-A77の4-wideが最大だ。これは、アウトオブオーダーマシンとしてAppleの性能CPUコアは、すでに効率的な性能向上の限界に近づいてきていることを示している。 >>809
何年か前のcoreでは、複数μOPに変換されるのがComplex Decoderでデコードされて、
1μOPに変換される命令だけ対応してるのがSimple Decoder
Complex Decoderのスループットも1命令/サイクルだったから、違和感ありまくり
それにネハ以降はデコード済みキャッシュを搭載していて、実行時間の多くを占めるループでは
デコーダを使わずに実行できるようにしていて、デコーダへの依存を少なくして消費電力軽減も行ってる 命令の消費クロック数をメモしながらアセンブラで書いてた身としては今のCPUでそんな単純比較できるのかって疑問しかないw
しようがないんだろうけどさ Skylakeのデコーダの数とかはIntelのスライド等で既知の情報だが
>A11以降は7命令/サイクルで実行ポートが13なのでA11はSkylakeの倍以上のIPCがある
のソースが示されていないからな。実アプリでの性能も示されていないし
Skylake
Decoder 5
ALU 4
Load/Store 3
Zen2
Decoder 4
ALU 4
Load/Store 3
A11
Decoder 7
ALU ?
Load/Store ?
ソースは後藤氏の記事 >>814
それにはデコーダの帯域しか書いていないしIPCがSkylakeの倍とも書いていない >>811
Neharemの頃の資料だけど
ttps://news.mynavi.jp/article/20081225-s_nehalem02/menu
の
ttps://news.mynavi.jp/article/20081225-s_nehalem02/2
ttps://news.mynavi.jp/article/20081225-s_nehalem02/3
NeharemのComplex Decoderは単純な命令でも1命令4サイクルで複雑な命令は
もっとサイクルが長くなる
そもそもx86の複雑な命令を1サイクルでデコードできるわけないだろうに
ちなみにApple A11以降にはマイクロ命令のL0キャッシュはなく直接デコードのみ >>816
嘘くさ こんな記事書いてたのかよ
Complex Decoderってのは、最大の命令長に対応するように、先頭に位置してんだよ
それが必ずレイテンシ4以上だったらボトルネックになんだろうが
マイクロコードROM参照しなければレイテンシ1ってのが伝統的な実装だったはずだが >A11以降は7命令/サイクルで実行ポートが13なのでA11はSkylakeの倍以上のIPCがある
のソースを提示できないって事はID:HvJ+uMZLの妄想なのかな >>818
CoreのデコーダのSimple、Complexの区分は変換されるμOPの数のはずだしな
なんか思い込みが強そう 1つのComplex decoder+複数のSimple decoderの構成は大分昔からだし、AMDだって似たような物だし処理系だって百も承知だろう
当然命令がそのように並ばないようにバイナリが生成されるはずでComplex decoderの負荷がどうのと言う指摘は的外れの可能性が高い
そしてコンパイラがSimple decoderを積極的に使うのであればプロセッサもそのように進化するわけで実際にそうなっている
野良で集計された物のようだがこんなまとめ資料がある
ttps://www.agner.org/optimize/instruction_tables.pdf >>820
最適化マニュアルにはマイクロコードROMを参照する命令は避けろって書いてあったはずだし、
マイクロフュージョン登場後はSimple Decoderでも”かなり複雑な命令”を扱えるようになったんだよね
それにデコード済みキャッシュ登場後はIPCはデコード済みキャッシュからの供給数が主体になってて、
これだとIPC6にはなってたと思う そもそも1命令あたりの仕事量は一般的にCISC>RISCでありIPCが高かったとしても実際の仕事を多くこなせるとは限らない ARM64でAMD64相当のパフォーマンスを得られるなら同様の手法を用いることでRISC-Vでも得られそう
で、Apple AはIntelに勝っているの人は何処行ったんだ? 超チープ?かどうかはともかく
大昔考えられた余計なアドレッシングモードがほぼ無いとか
浮動小数点演算命令は新し目のSIMD系命令が標準とか
そこら辺は超有利だよね! 余計なアドレッシングモード?
CISCのメリットとして上げようと思ったくらい便利だぞ
普通の整数計算でもアドレッシング計算命令を頻繁に使うほど x86はSIMDも非常にリッチ
これに比べるとARMのSIMDはうんこ >>827
アセンブラで書くのが便利?
メモリアクセスはペナルティが大きいから過去の話っしょ >>829
今時の高性能プロセッサはアウトオブオーダー実行が標準装備だしロード待ちの命令があっても依存関係のない他の命令から実行していくでしょ
むしろそうなるようにコードを並べるのがプログラマやオプティマイザの仕事 >>829
アセンブラでもコンパイラでも便利
メモリアクセス?
突然どうした? >>830
> 依存関係のない他の命令から実行していくでしょ
> アドレッシング計算命令を頻繁に使うほど
いくら依存関係が無くても詰まるっしょ >>827はコンパイラがそういうコードをはくってこと
アセンブラで手動でやらなくても SIMD系命令に至っては、コンパイラは、もう諦めたと言うか
intrin.hやarm_neon.hで自分で埋め込めや!状態だしな…orz SIMDをコンパイラに丸投げはまだ時代が早すぎる
速度が重要な小さなループは
アセンブラやintrinsicを使った方が良い
x86だと非常にリッチなSIMD命令が使える
AMDはSIMDもチープ 何を使おうがコードの書き方で速度は大幅に変わる
コンパイラは値が変わらない範囲でしか最適化をしてくれない
浮動小数点は計算順番で値が微妙に変わるから最適化しづらい
C言語だろうがアセンブラだろうが
パフォーマンスが必要なら
依存関係を減らしたり最適なデータ構造を考えるのは
プログラマーの仕事 ■ このスレッドは過去ログ倉庫に格納されています