CPUアーキテクチャについて語れ 53
レス数が1000を超えています。これ以上書き込みはできません。
!extend:checked:vvvvv:1000:512
↑
次のスレを立てる時に上の文字をコピーしてください
前スレ
CPUアーキテクチャについて語れ 52
http://egg.5ch.net/test/read.cgi/jisaku/1623126064/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured Snapdragon8cxGen3が思ってたより面白い構成だ。結構性能あるかも。
Cortex-X1 * 4 + Cortex-A78 * 4 Cortex-X1のクロックあたりの性能が超ざっくりZen2ぐらいなのでM1超えでは多分無いです。
でもやっと欲しいと思えるSoCが来たよ >>949
それファームウェアの一部に IBM 価格のライセンス代が必要なので、「$3,500 上乗せになっても買う?」というアンケートを取っているという話題す。
詳細わこちら
https://www.phoronix.com/scan.php?page=news_item&px=POWER10-Blobs-Raptor
とこちら
https://twitter.com/RaptorCompSys/status/1470899578459328513
追加の$3,500を端金と思う方専用というコトで(笑)
https://twitter.com/5chan_nel (5ch newer account) 英語圏→Power/Sparc等、UNIX系システムのRISCの解説サイト・ブログ・動画などが
結構ある
日本→古い研究室のサイト・ブログ等ではあるが、基本ほぼx86
もしかして、自分たちの手の届く範囲にないアーキテクチャには
興味がない?日本のCPU界隈
まあ、。個人がそれらのシステム買っても市販のpcソフトが動くわけじゃないからね 日本メーカーはMIPSやRISCワークステーションに投資して大損ぶっこいてるからな。
関係者も客にボロクソに言われてるわけで黒歴史なんだよ。 >>958
>>955の経緯で英語圏で POWER の最新システムを個人使用できる人数が可視化されるす
楽しみすね(笑) >>959
それメーカーの見る目や能力がげふんげふんつーことにならんか 英語圏何億人いると思ってるんよ?
そも米がこの業界の本場やで。日本人や中国人が米IT業界を追撃すべきとか言った所で
総合力では英語圏に勝てるわけないんや。
>>959
その遺産なのかもしれんが、MIPS組み込みは結構多かったね。
今はそのへんもARMに移行しているのだろうか。 >>963
NECや東芝がMIPSチップ作ってたしね。
富士通はA64FXとSPARC64で設計を共通化するって書いてたけど
SPARCの方は製品化されてないよね。
開発は続けてるんだろうか。 本屋行ったら今時めずらしいアセンブラの本なんかあった
しかも初版発行2021年9月
目次見た限り最新の内容までカバーしてる感じではなかったけど
https://i.imgur.com/MzIghuV.jpg アセンブラは
データシートや命令セットリファレンスを見るのが一番
パフォーマンスは色々と実験しないとわからん いやz80程度ならバイナリのまま読み書きするから脳内アセンブラもいらん。 いまだにAVX512, NEON, SVEやDSPなどアセンブラ使ってます! シリコンの原子半径より狭いゲート長で動作するのだろうか
クックの技術に期待するしか >>965
横にある『プログラミング副業』で何かワラタ >>975
電子の大きさは未解明だそうだ。
ゲート長よりもON電流を稼ぐ必要がある
らしいぞ。ゲートの電圧でON/OFFを制御
しているから、ON電流が一定以上ないと
ONと判定できないらしい。 この前x68kのソースのぞいたらloop命令使ってたよ。
あんな使いにくい命令使う人いるんだねぇ。
ファランクスダンプしたら同じメモリポストインクリメント命令だーっと並べて、命令数でタイミング調整してて笑ったわw違う意味で賢いよねw 遅延や粒度が荒くていいならタイマ割り込み使えばいいが、
それ以外にどうやってns単位の時間を計ってイベントを発生しろと言うのか。 つい最近量産品のコードで
アセンブラを使ったクロック単位の時間調整をやったばかりだ
10円近くコスト削減 ソフト:無駄命令並べる
論理回路:notゲート並べる
基盤:配線をクネクネして遠回りさせる
これが同期の基本技。 x86(intel)のVnni(ニューラルネットワーク命令)に対応した
ソフトウェアをPower10MMA向けに移植すれば
画期的なパフォーマンスがでるわけだが、何故どこのソフトメーカーも
やらない? IBMがPower10MMAとAVX512VnniのAI推論比較を
講演でデモンストレーションして、
「我々の方がintelよりAI推論において高度なソリューションを
提供できる」とかやればいいのに まず君がQEMU使ってコード書いてオープンソースで公開すれば? 性能が欲しい顧客はGPGPU使うだろうし
エッジで利用するならARMかx86だろうし
POWERでわざわざ推論実行するユーザーってあまり存在しないような ではPower10MMAはどのユーザーをターゲットに? お勉強は好きなんだろうけど拘り強過ぎてbot化してんじゃねーか。 >>986
どこかで見たがPower10MMAは
6Tflopsほどあるらしい
GPGPU⇒プログラマブル性にかける
x86/ARM ニューラル命令⇒パフォーマンスがいまいち
Power10MMA⇒パフォーマンスも高く
プログラマブル わざわざCPUで推論するのは比較的軽いモデルでレイテンシを余程小さくしたい時くらいじゃないかな。
学習する場合は普通PyTorchとかTFとか使うから、GPUだから使いにくいなんてことは事はないし、莫大なIBM税払って6T程度じゃ全然合わんぞ https://www.ibm.com/blogs/systems/jp-ja/wp-content/uploads/sites/8/2021/05/power10-mma.jpg
これ見ると。Power10MMAは軽いモデルじゃなく重い方も対応してる
メリットと言えばPower10はTDP100wぐらいだから、その100w内で
6TflopsのAI推論(重い方も含め)処理ができることだな 出来る出来ないじゃなくて用途の話なんだけど、まぁいいか アセンブラも禄に書けないのに何がプログラマブルだよ。
6TFLOPSって並列演算性能なのにどんな複雑なコードを書くつもりなんだ。 Power10MMA⇒売れてないから使えないオワコンアーキ MMAってMatrix用の拡張だろ?
x86ならAVXではなくAMX、ArmならSVEではなくSMEだろ?
例えばSapphire RapidsならBF16で1024flops/cycleだから
1タイル14コアの3GHzとすれば43TFLOPSだし
4タイル56コアの2GHzだったら115TFLOPSじゃね? 実験室内で培養した人の「ミニ脳」にゲームをプレイさせることに成功、AIよりも速いわずか5分で習得
ttps://news.livedoor.com/article/detail/21389798/
始まったな このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 93日 22時間 42分 7秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。