Snapdragon8cxGen3が思ってたより面白い構成だ。結構性能あるかも。
Cortex-X1 * 4 + Cortex-A78 * 4
Cortex-X1のクロックあたりの性能が超ざっくりZen2ぐらいなのでM1超えでは多分無いです。
でもやっと欲しいと思えるSoCが来たよ
0955MACオタ>949 さん (ワッチョイ c7f5-1dL3)2021/12/16(木) 17:54:59.18ID:2LAjCE2T0
0956MACオタ>948 さん (ワッチョイ c7f5-1dL3)2021/12/16(木) 17:58:22.73ID:2LAjCE2T0
0957Socket774 (ワッチョイ dfb1-PFkU)2021/12/16(木) 20:16:57.60ID:Mxb5CTrc0
13600KのGPUはRTX1650系
0958Socket774 (ワッチョイ 6a03-izju)2021/12/17(金) 03:12:42.08ID:foRaRv2z0
英語圏→Power/Sparc等、UNIX系システムのRISCの解説サイト・ブログ・動画などが
結構ある
日本→古い研究室のサイト・ブログ等ではあるが、基本ほぼx86
もしかして、自分たちの手の届く範囲にないアーキテクチャには
興味がない?日本のCPU界隈
まあ、。個人がそれらのシステム買っても市販のpcソフトが動くわけじゃないからね
日本メーカーはMIPSやRISCワークステーションに投資して大損ぶっこいてるからな。
関係者も客にボロクソに言われてるわけで黒歴史なんだよ。
0960MACオタ>958 さん (ワッチョイ bff5-9b1d)2021/12/17(金) 06:15:44.08ID:1u7tb08K0
>>958
>>955の経緯で英語圏で POWER の最新システムを個人使用できる人数が可視化されるす
楽しみすね(笑) >>959
それメーカーの見る目や能力がげふんげふんつーことにならんか 英語圏何億人いると思ってるんよ?
そも米がこの業界の本場やで。日本人や中国人が米IT業界を追撃すべきとか言った所で
総合力では英語圏に勝てるわけないんや。
>>959
その遺産なのかもしれんが、MIPS組み込みは結構多かったね。
今はそのへんもARMに移行しているのだろうか。 >>963
NECや東芝がMIPSチップ作ってたしね。
富士通はA64FXとSPARC64で設計を共通化するって書いてたけど
SPARCの方は製品化されてないよね。
開発は続けてるんだろうか。 0966Socket774 (ワッチョイ 4aad-n/si)2021/12/17(金) 13:05:00.81ID:Wu4QIs4P0
今どきアセンブラか
昔はずいぶんやったけど
アセンブラは
データシートや命令セットリファレンスを見るのが一番
パフォーマンスは色々と実験しないとわからん
いやz80程度ならバイナリのまま読み書きするから脳内アセンブラもいらん。
いまだにAVX512, NEON, SVEやDSPなどアセンブラ使ってます!
シリコンの原子半径より狭いゲート長で動作するのだろうか
クックの技術に期待するしか
>>965
横にある『プログラミング副業』で何かワラタ >>975
電子の大きさは未解明だそうだ。
ゲート長よりもON電流を稼ぐ必要がある
らしいぞ。ゲートの電圧でON/OFFを制御
しているから、ON電流が一定以上ないと
ONと判定できないらしい。 この前x68kのソースのぞいたらloop命令使ってたよ。
あんな使いにくい命令使う人いるんだねぇ。
ファランクスダンプしたら同じメモリポストインクリメント命令だーっと並べて、命令数でタイミング調整してて笑ったわw違う意味で賢いよねw
遅延や粒度が荒くていいならタイマ割り込み使えばいいが、
それ以外にどうやってns単位の時間を計ってイベントを発生しろと言うのか。
つい最近量産品のコードで
アセンブラを使ったクロック単位の時間調整をやったばかりだ
10円近くコスト削減
ソフト:無駄命令並べる
論理回路:notゲート並べる
基盤:配線をクネクネして遠回りさせる
これが同期の基本技。
0983Socket774 (ワッチョイ 6a03-izju)2021/12/19(日) 21:05:01.96ID:iEA5fZE20
x86(intel)のVnni(ニューラルネットワーク命令)に対応した
ソフトウェアをPower10MMA向けに移植すれば
画期的なパフォーマンスがでるわけだが、何故どこのソフトメーカーも
やらない?
0984Socket774 (ワッチョイ 6a03-izju)2021/12/19(日) 21:09:15.84ID:iEA5fZE20
IBMがPower10MMAとAVX512VnniのAI推論比較を
講演でデモンストレーションして、
「我々の方がintelよりAI推論において高度なソリューションを
提供できる」とかやればいいのに
まず君がQEMU使ってコード書いてオープンソースで公開すれば?
性能が欲しい顧客はGPGPU使うだろうし
エッジで利用するならARMかx86だろうし
POWERでわざわざ推論実行するユーザーってあまり存在しないような
0987Socket774 (ワッチョイ 6a03-izju)2021/12/19(日) 21:54:00.87ID:iEA5fZE20
ではPower10MMAはどのユーザーをターゲットに?
お勉強は好きなんだろうけど拘り強過ぎてbot化してんじゃねーか。
0989Socket774 (ワッチョイ 6a03-izju)2021/12/20(月) 09:48:45.98ID:Jt8PGlDU0
>>986
どこかで見たがPower10MMAは
6Tflopsほどあるらしい
GPGPU⇒プログラマブル性にかける
x86/ARM ニューラル命令⇒パフォーマンスがいまいち
Power10MMA⇒パフォーマンスも高く
プログラマブル わざわざCPUで推論するのは比較的軽いモデルでレイテンシを余程小さくしたい時くらいじゃないかな。
学習する場合は普通PyTorchとかTFとか使うから、GPUだから使いにくいなんてことは事はないし、莫大なIBM税払って6T程度じゃ全然合わんぞ
出来る出来ないじゃなくて用途の話なんだけど、まぁいいか
アセンブラも禄に書けないのに何がプログラマブルだよ。
6TFLOPSって並列演算性能なのにどんな複雑なコードを書くつもりなんだ。
Power10MMA⇒売れてないから使えないオワコンアーキ
MMAってMatrix用の拡張だろ?
x86ならAVXではなくAMX、ArmならSVEではなくSMEだろ?
例えばSapphire RapidsならBF16で1024flops/cycleだから
1タイル14コアの3GHzとすれば43TFLOPSだし
4タイル56コアの2GHzだったら115TFLOPSじゃね?
0998Socket774 (ワッチョイ 0a6e-Td6/)2021/12/20(月) 22:29:46.24ID:5XTnt2Oj0
実験室内で培養した人の「ミニ脳」にゲームをプレイさせることに成功、AIよりも速いわずか5分で習得
ttps://news.livedoor.com/article/detail/21389798/
始まったな
10011001Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 93日 22時間 42分 7秒
10021002Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php