Intelの次世代技術について語ろう 103
■ このスレッドは過去ログ倉庫に格納されています
演算の依存関係を意識しない糞コードに対する性能アップが特に大きい
性能アップが大きいコードが必ず糞というわけではないが
糞の可能性は大きい 何を走らせるかで効率は変わるけど普通の処理なら少なくとも10〜20%くらいの性能は出るよ
どう見たって実装面積は10%もないから高効率 >>220
なるほどメインメモリへのアクセスが鍵と。
衒いなく文字通りの素人質問だけど、
分割は容易、分割後の内部は相互依存が多い、メインメモリへのアクセスが多い計算では、
同じMIPSなら低クロックで多コアな方が有利なのかな? 逆にメモリバンド幅がネックとなる数値計算では効果がないか微妙に遅くなるきともある。
バンド幅には問題なくてメモリレイテンシがネックとなる処理ならガンガン性能が出るんだが。 >>221
ハイファは純粋に技術的な観点で疑問視してたけど、ヒルスボロ?ポートランド?はマーケティング的なメリットで納得させたンじゃねーの。 TEAMGROUPは、RGB照明を備えた最初のDDR5メモリであるT-FORCE DELTA RGB DDR5 GAMING MEMORYを発売することにより、業界のパイオニアであり続けています。
このメモリでは、装備されている各RGBLEDライトを個別に色と速度をプログラムできます。DELTA RGB DDR5 GAMING MEMORYは、16GBまたは32GBの5,200MHzシングルチャネルメモリキットと、2X16GBまたは2X32GBのデュアルチャネルメモリキットを提供します。最新のIntelXMP3.0、ワンクリックオーバークロックテクノロジー、ECC機能をサポートし、
さまざまな照明制御ソフトウェアとの互換性テストのために、ASUS、ASRock、BIOSTAR、Gigabyte、MSIなどの主要なマザーボードメーカーにも送信されています。 。この新しいエキサイティングな製品は、2021年の第4四半期に購入できるようになります
https:///i.imgur.com/NDSX3fP.jpg
https:///youtu.be/23nnFyX_vxw AlderlakeはDDR4版マザーの互換どうなるかな?
キャッシュなどの小改良+eコア増量のRaptorlakeまではDDR4/5対応で続いてほしいが >>226 i9-7980XEやW-3175XでLinpackやy-cruncherのπ計算やると、帯域よりレイテンシ低い設定の方が速かったりする。
DDR4-3800 CL15-1T>DDR4 3600 CL15-1T>DDR4-4000 CL16-2T
現実的なプログラムではメモリ帯域ベンチ(バースト転送率95%以上とか)みたいのは少なくて、DDR5の内部2ch化は現実的な
アクセスパターンでの効果を狙っているのかな。
>>231 そいう意味じゃDDR5サポートしてるのにDDR5使わないのはもったいない気がする。 >>147
競争は大事だが競争維持のために買ってる訳じゃないからなー
今はインテル買えねえよ Alder爆熱だしやはりZen4が本命だな
EUV世代以外は買う気しないわ Zen4でもCPUチップレット1個のやつは
発熱厳しいかもしれんぞ
5800Xも厳しいらしいからな インテルがマザボメーカーに圧力をかけて、5800X感知時に電圧を高めにするようにしているらしいからな AMDのスレの方もそうだけどPenD時代のノリで煽ってるしょうもないおじさんがいるよな TDPと消費電力を混同してる奴まだ居るしな
年取って情報の更新が出来なくなるってこういう事かと思うよね CoreプロセッサーのTDPが4.5Wだった頃が懐かしい
あの頃はPCHやeDRAMも統合して
1W未満を目指すものとwktkしてた >>241
AMDがなければそういう未来もあったかもしれない
ここはAMDに対抗するために電源もりまくったルート >>241
ファンレスMacBook2015(Core M)とファンレスiPad 2014が同じ性能だったな
前者はすぐ熱だれするけど、、、
なお、MacBook2016と2017はだいたい10%ずつくらいの性能アップ
iPadは2015の時点で性能2倍で振り切った CPUアーキスレはカビの生えたコテハンが居座ってるからな >>241-242
それこそARMのシングルボードでええやん エリート/プレミアム厨でもありif厨(?)でもある。
カウンセリングが必要かもな。 >>239
> 同じTDP枠と発熱でどれだけ高性能を出せるかをAMDやIntelやAppleは競争してる
してるっけ?インテルなんかイチ抜けた!っていって我が道を行ってるだろ……
>>240
TDPと消費電力を混同してる年取ったおじいちゃんはいないだろう
おじいちゃんたちはまさにその世代だろ
自作をやり始めたばかりのキッズじゃないかそれは
おじいちゃんで多いのはTDPで止まってて、PL1, PL2やオペレーティングレンジのことを知らない人は結構いそう >>248
Intelの場合は「イチ抜けた!」ではなく「諦めた!」ではないだろうか イチ抜けしたのは競合他社より1年早くTSMCの最先端プロセスを使えるApple
来年以降もこの傾向が続く ここは自作版でデスクトップ用途がメインだからバッテリーが足枷となるモバイル用途と比較しても意味がないよ
A15もゲームを走らせればサマスロ起こしてフレームレート維持出来ないのは周知の事実だしどのメーカーも苦しんでるよ ネットワークに特化したIPUのMount Evansでシェア拡大を狙うインテル インテル CPUロードマップ
https://ascii.jp/elem/000/004/070/4070140/ >>250
誰も微細化の話なんかてしてないんだが
巣に帰れよ >>250
ところがalderはリークの数字を15W駆動可能な3.0GHzあたりに合わせるとM1と互角の数字になってしまう
まあ実物がでないと分からんけど、10nmで5nmと勝負になるかもしれんという。 >>255
実質5コアの3.2GHz M1(TDP 6W)に16コア3GHz(15W)で同等なのかよ、、
Zen3とM1のIPC差からして、Alderは少し差が縮むはずでは? >>256
15W版は2P+8Eしか出ないから、コア数とクロック両方合わせたときにM1とほほ同じになる
M1はA13(98.5mm2)より37%大きいとされるが、
alderのEコアは4つでPコアとほぼ同サイズで、2P+8Eはtigerの4コア(146.1mm2)と似たサイズになる
つまり両者とも140mm2前後似たサイズで、3.0GHzをちょっと超えるくらいでcinebench R23で7000点くらい、という算数になる
今まで出てる数字で、中学生レベルの比例計算の算数をすると、
10nmのintelと5nmのappleがほぼ同じダイサイズでほぼ同じ性能をほぼ同じ消費電力で達成するという謎現象が起きることになる。 消費電力は出てみるまで全くわからんな
通常通りならAlder Lake-P(15w)はPL2-55w動作で消費電力15Wとはほど遠い存在だから >>257
>次世代CPUはカセットカートリッジ方式になる。
Slot 1 Pentium2 時代にその道わ通ったかと(笑) >>260
E-COREで消費電力を落とせるなら、いつもどおりノートの方を先に出すでしょ
15-28Wクラスを出せなかったということはそういうこと。 >>260
tigerのときはcTDPが12-[15]-28Wで、公称15Wだけど実質28Wだろってツッコミがあったのだが
alderは12-[15]-20と20-[28]に分けられるのよね。上限28Wのほうは最大6P+8Eになるとされてる
なので2P+8Cはtigerの1165G7あたりより省電力にしたいらしい >>264
こうやってみるともうGoldenCoveコア2つでいい気がするな。つうかそうしないと電気食うばっかりだろ。
どうせP-Coreフルで回るのってシングル動作するときくらいだろ。マルチでわちゃわちゃ動く用に
E-Core大量に乗せとけ。 いっぱい乗せればいっぱいつおい
って世界じゃないんだよなぁ >>264
同じ条件(tiger-4C-UP3とalder-2P8E-P)でPL1-2-4が
tiger 28W-60W-105W
alder 15W-55W-123W
か
PL4は記事中の表記では最大10ナノ秒なので消費電力や発熱を見るならtigerより減少か 4c tigerが15Wで回るクロックは1.2GHzぐらいなんだが
プロセスも変わってないのにそんなに改善するのかね >>260
それな
可変TDP(15〜55W)と固定TDP(15W)と比較しても意味がない 核抑止力:デルはシミュレーション用に新しいIntel SapphireRapidsを出荷します
https://allinfo.space/2021/09/22/nuclear-deterrence-dell-ships-new-intel-sapphire-rapids-for-simulations/
デルは、2022年から核兵器のシミュレーションに使用される新しい米国のスーパーコンピュータ向けにSapphire Rapidsを搭載したIntelシステムを提供します。
システムは2025年までに継続的に拡張され、最終的に40PetaFLOPSのパフォーマンスを提供します。
デルは、新しいPowerEdgeサーバーを注文し、2022年半ばからIntel SapphireRapidsを搭載した最初のシステムを提供します。
これらはスケーリング用に設計する必要があり、1.5ペタフロップスのパフォーマンスを持つ小さなノードは2025年までに最大40ペタフロップスに拡張できるはずです。
全体として、エネルギー省の国家核安全保障局(DOE / NNSA)は3つの場所をアップグレードしています:ローレンスリバモア国立研究所(LLNL)、ロスアラモス国立研究所(LANL)、サンディア国立研究所(SNL)。 >>268
わいの1165G7ノートがすぐに100℃になってサーマルスロットリングになるから
100℃ギリギリまでクロック上げるクソ熱設計だとおもう Intelの納期が遅れ、米国エネルギー省は緊急時にNvidiaからスーパーコンピューターを購入する
https://news.cnyes.com/news/id/4709937?exp=a
情報筋によると、米国最大の研究所であるANLがNvidiaとSupermicroからコードネームPolarisを購入しても、Intelの「Aurora」スーパーコンピューターに取って代わることはなく、
PolarisはAuroraのソフトウェアテストマシンになるという。
情報筋によると、PolarisスーパーコンピューターはNvidiaのA100GPUとAMDMilanサーバーCPUを使用しています。PolarisスーパーコンピューターにはExaFLOPが搭載されていますが、
そのパフォーマンスはAuroraスーパーコンピューターほど強力ではなく、ほとんどの計算速度が遅くなっています。 動かせない高性能機と堅実に動く汎用機
語るにしかずだな Polaris は
ttps://ascii.jp/elem/000/004/068/4068929/3/
でも記事になってて性能的には
Frontier (1.5ExaFLOPS) > Aurora (1ExaFLOPS) >> Polaris (44PFLOPS)
だな。
Frontier は EPYC + Radeon Instinct の構成。
Frontier と Polaris のどっちが先に稼働するんだろうね。
順調に行ってれば Intel の Aurora が世界初のExaFLOPSスパコンになる筈だったが
どうやらFrontierにその座を奪われそう ちなみに富岳は442PFLOPSなのでPolarisの10倍くらい速い。
Auroraは富岳の倍以上速くなる予定。 >>272
44PFLOPSなのに「PolarisスーパーコンピューターにはExaFLOPが搭載されていますが」
ってなんか変だなと思ったら
同じ8月25日の英語ニュースサイト
https://finance.yahoo.com/news/u-department-energy-argonne-national-100000336.html
を読むと、bfloat16 なら1.3ExaFLOPSって意味なんだな。
NVIDIA A100は倍精度とbfloat16で約30倍性能違うから計算あってる。 Intelの gpuはダイサイズが異様に小さいところがポイント
ダイサイズが1000sp 64mm2
3000sp 190mm2
4000sp 250mm2
程度で済んでて、実はハイエンドでも3050やrtx6600/5700並みのダイサイズなので7nmの倍コストの計算としても、
128EUで150ドル
384spで400ドル未満
512sp16GBで549ドル+税レベル
のお値段で勝負できるだろうと
無論Intelの一元生産や価格調整使えば、生産原価抑えて150-600ドル帯なのに利益をたくさん乗せられる結果になろうと
ここら辺は他社の量産性、生産性が低い gpu市場だからIntelが一元生産すれば安くできる市場ではあった
ここにダイサイズがミニマムという恩恵を発揮すれば、Intelは激安でも利益をだせて覇者になれる
各プロセスの生産コストは
5nm 200%
6nm120-150%
7nm100%
14nm50%くらいのコストだ
対し128EU版が 64mm2ならば、製造コストは14nmで123 mm2のrx460とほぼ大差ないレベルまで安くなる
そしてgtx1660並みの性能かつrx460より高い150-200ドル級の値段で売れれば利益はやばいことになるだろう
いま65w/6GB/1660以上なカードがでれば税込19000円でも安い→馬鹿売れだろう
384EU版がrx6600XT程度で税込39800円でも馬鹿売れ
512EU版がrtx3080弱の性能で税込67800円でも馬鹿売れだろう
この激安価格でもrtx3080異常に利益がでる計算になる
ハイエンド512EU版の gpuの推定原価は150-200ドル未満
メモリ16GBは60-80ドル
基盤込み梱包、製造原価は300-400ドル
小売に550ドルでおろしても利益は200ドルと10万のカード並み
小売に定価599ドルを要求すればOK
対しrtx3080やrx6800のgpu原価は倍の200-300ドルのカード原価は500-600ドルになる
小売の仕入れ価格はやすくても700-800ドルだ Loihi 2に関するAnandtechのインタ
https://www.anandtech.com/show/16984/an-interview-with-intel-labs-mike-davies
Intel 4について言及されているが
行間からRKLやICL-SPなどの遅延は10nmの工程が複雑化しすぎてデバッグが遅れたからと読める
Loihi(Neuromorphic computing)は平たく言えば「エッジAIにラーニングを持ち込む」ための技術
ML需要がクラウドからエッジへ流れるわけだからハード・ソフト共に強烈なアーキテクチャの変動が起きる
社会へ与える影響も大きい
例えば医師のような配置と育成に多大なお金・時間を費やしなければならない人材をAIに置き換えられる可能性が高い 機械学習って言われると突然盲目になるやつ多すぎんよ。
特殊技能持ち技術者の置き換えをエッジでやる必要あんのかと。クラウドやサーバ規模のマシンでまだ出来てないことをエッジなら出来るとか、頭湧いてんのか。
まず基本に立ち返れ。 LoihiはトラディショナルなMLとは全く異なるアプローチ
>クラウドやサーバ規模のマシンでまだ出来てないことをエッジなら出来る
まさにこの可能性があるから革新的なのだ
イメージとしては現場で、OJTで、人間のように育てるチップ
もちろんその時間的、資金的なコストは人間よりも低くなるだろう Intel 4はLoihi 2で登場か
意外なものから4nm(旧7nm)きたな 具体的にこの種の研究成果はどのような形で具現化されるのだろうか?、昆虫の視覚能力を会得したチップを
埋め込まれベルトに風車発電機を装着した特殊コマンドとかかな >>286
でもintel4は名前だけになったから実際は7nm立ち上げ失敗してても
10nm++++あたりを名前だけintel4にして出荷しそうで怖い さすがに密度がTSMC 4nm相当じゃなければ叩かれる
本命の20Aを前にして騙すのは不味い じゃぁ、Intel6が飛び出してきたりして
とにかく毎年数字減らしそう >>285
機械学習は入力した情報に応じた精度しか出せないが、エッジだけで入力する情報量がそこまで行くかどうか。
現場での学習は、スパムフィルタに毛が生えた程度の、人間がリーズナブルなコストで教師信号を与えられるキャリブレーション用途に限られる気がする。 エッジでしか出来ないことがある
エッジの強みは応答性 今年の第2四半期にテープアウトでプロセスも既に立ち上がってる
てことはMeteor Lakeが2022年にギリギリ間に合う可能性あるな
とは言えもとより2022年は新製品ラッシュ、まずは様子を見てみよう >>292
推論なら応答性能が欲しいってのもわかるけど
今話してるのは学習の方なわけで要らんでしょ。 Tri-LabCTS-2システム契約賞が発表されました。リバモア、ロスアラモス、サンディア国立研究所で構成されるNNSA Tri-Labパートナーシップは
、合計40ペタフロップス以上の商用HPCシステムを供給する4000万ドル以上の契約をDellTechnologiesに授与しました。
https://www.hpcwire.com/2021/09/28/nnsa-selects-dell-for-40m-cts-2-commodity-computing-contract/
計画は、ムーアの法則をもう一度変えることだと思われます。ラボは、主にストレートx86ギアを選択しており、次の「Intel 7」サファイアラピッズCPUと、
利用可能になったときに、そのCPUの高帯域幅メモリ(HBM)バージョンを搭載しています。Dell PowerEdgeシステムは、2022年半ばにインストールされ、2025年まで配信が継続されます。
CTS-2ハードウェアは「スケーラブルユニット」(SU)として展開され、Tri-Labコンプレックスにモジュラービルディングブロックを提供して、より大規模なシステムを構築します。
CTS-2 SUは約200ノードで構成され、約1.5ペタフロップスの計算能力を提供します(SUあたり)。
CTS調達プログラムは主に全CPUの「主力」システムに焦点を当てていますが、ライリンガー氏は、この契約により、HBMやGPUを搭載したCPUなど、いくつかの多様なテクノロジーの要求も容易になると述べました。
この1.5ペタフロップスのシステムは少なくとも当初はGPUを用いずサファイアラピッズCPUとHBM(利用可能になった時に)で構成されるようです >>293
微細化が進んでから工程が増えたせいで改良ポイントが増えてる感あるから、
intel4が順調であったとしても、まずは試しから入って本命の主力はintel4+からとかになりそうな。
量が出なくてお試し生産に向いた製品は例えば不人気Xe-DG1の新バージョンとか使いそう CannonLakeの例からしてIntelの新プロセスで難航するのはGPUの方じゃないかと思う
だからチップレット方式のMeteorLake以降のGPUダイはTSMCと予想 >>298
出たとしても北米でしょ
日本発売は無理 dGPUが遅れ気味なのが気になる
2022Q2ってライバルはQ4に新型なのに ララビーなんて世に出てないし
別に遅れても驚きはしない
研究開発をちゃんとやってブレークスルーに繋げられるように頑張れ ARCはモバイル版が1Qに出るんだから
自作erが後回しなのはいつものこと…… >>305
Larrabeeは一応Xeon Phiという形で製品化されたから…
まあGPUとしての製品化じゃなかったけどな… 雇用された学生は時給25ドル貰って教育を受けて
教育が終わる2年後には年俸約6万ドル(そこから更に急激に上がる)と書かれているように見えるな ボーイングが737MAXでやらかしたのと同じパターンじゃないですか マイニングに限らずGPGPU需要は多いからintelとしては抑えておきたいところやろな
ARM系もnvidiaもそこからCPU市場に進出してこようとするし、
経営的には潜在的ライバルを価格競争で削りに行く必要もある https://www.appbank.net/2021/10/07/technology/2135384.php
消費電力が気になる
ここさえクリアすればZen4が出るまでAlderLakeの独壇場になるがはたして…
爆熱オレゴン思想全開だったらTDP65Wの5600Xを買うわ 中長期的に見てずっと爆熱化トレンドだし
爆熱化は避けられない運命だ
諦めて200V電源を用意しな おかしいな
俺のM1 Mac miniはTDP15Wで通常使用時ほぼ無音なんだが…
FF14拡張やりたいから自作WindowsPCは1台組む予定だけど
爆熱化トレンドなのは共にオレゴン思想全開のIntelとGeForceだけでは? ■ このスレッドは過去ログ倉庫に格納されています