Intelの次世代技術について語ろう 103
■ このスレッドは過去ログ倉庫に格納されています
だから製造面でもApple以外も作ってるTSMCが強いんだ
IntelはPCと鯖の独占状態を維持して利益率を向上させる事で捻出するという最初から無茶な計画 >>162,167
Intelがカードの製造するなんて話あったっけ?
DG1ではAIBパートナーに丸投げしてたはずだけど >>171
なんかよく分からんけど、だから製造だけを請け負うってビジネスがあってそこを利用する企業があるんだけど。
こんなの10年(20年?)くらいまえからのトレンドだし。
ふるくはルソーの社会契約論で唱えていることを分業制を実践しているだけともいえるけど。
でもファブレスを利用しているからといってその企業が成功するわけでもないけどね。
デジカメだとニコンはソニー製のセンサーを使って、キヤノンは自前でセンサーまで作ってる。
ニコンは青息吐息だけどキヤノンの財務は盤石。
話を戻すと、最近はTSMCしか作れないから地政学的リスクとか供給量の限界が一企業に左右されかねないと懸念する向きもある(実際そうなんだけど)。
ただ>>167の頭はお花畑。
IntelのCPU一つあたりには自社ファブの諸々の経費が乗っかってくる。
AMDの場合はTSMCに支払った金額が乗っかってくる。
それが言いたかったんだろうけど。
Intelの方が有利かどうかはあっちの金融マンとかじゃないと分からん。
ゲルちゃんが示したロードマップ通りにことが運ぶなら安定した量を供給できるインテルが強いか?
でもそれもファブの経費次第だけどな
ここんところインテルはいいところがないからか陰厨の確証バイアスが強くかかりすぎて笑っちゃう 経営者が変わっただけで今までのプロセスルールの遅れが取り返せるとは思えないのよね
遅れる理由はエンジニアリングの問題
経営の問題というより技術者の問題だよね
インテルは研究開発予算は潤沢だし、人材も超一流を集めてる
それでもTSMCに勝てないのは、台湾人というチート級の有能人種の力に寄るところが大きいと思う
(AMDリサスーもNVIDIAジェンスンも台湾系、その他、無名の台湾人エンジニアも優秀な人が多い)
台湾のコロナ対策を見ると、台湾人の有能さがよく分かる
原因特定能力と排除能力が半端ない
たった3日ほどで行動履歴追跡ツールを作ったIT大臣オードリータン氏も凄い
台湾系エンジニアを増やすことでしか(つまりTSMCから引き抜く)
Intelの逆転の目はないように思う ちょうどいいタイミングで記事来てたわ
>>162,167の妄想全否定されてるね
Ponte VecchioとIntel Arcに関する疑問をRaja Koduri氏が回答 インテル GPUロードマップ
https://ascii.jp/elem/000/004/069/4069704/3/
>なおIntel Arcは、すでにリファレンス・デザインが存在しており、パートナー企業に
>そのデザインを引き渡してはいるものの、例えばNVIDIAで言うところのファウンダーズ・エディションに
>相当する製品モデルを出すかどうかに関しては「パートナーやODMの差別化が行われることになるとは思うし、
>それが最終的な顧客の利益につながる」と答えるにとどめ、明確な答えはなかった。 >>175
原因特定と排除能力が必要なのは経営陣の方だよ
いくら下の技術者が何か提案したとしても上の人間がそれを受け入れなきゃ意味がない
Intelはクルザニッチ時代にコバルト配線に固執して失敗した でもインテルはもうtsmcにどんどん任せてくって聞いたけど Intel 7nm(現在の名称はIntel 4)の大量生産が成功するまでの繋ぎとしてTSMCに外注だよ
しかしながらEUV露光品の製造に成功しているのはTSMCだけであることを考えると障壁は高い
※Samsungは歩留まりに問題が生じている(一応出荷してるがTSMCに対する技術的優位性はまったくない) そんなの常識だろ
ASMLがシェア100%なんだから
EUV露光品 = EUV露光製造装置を使って製造した半導体製品 の短縮形だよ Alder期待してるんだけど噂レベルだと下位はEコアが少ないのな
Eコアはハイエンドで爆熱の限界を超えてマルチスレッド性能を嵩増しするための存在でしかないんだろうか
下位グレードこそ高効率でエコなCPUにしてほしいものなんだが… i3 4+4〜8 Pen 2+4〜8などにいつかなる? >>184
モバイル向けは漏れなくEコア8つ搭載だよ
デスクトップでのEコア需要が分からんし、
省電力需要が多ければモバイル向けのperformance帯SKUを回す感じでしょ
デスクトップへのEコア標準搭載はEコアのメリットが大きいと確定して以降だと思う 速度遅すぎて実用性がない
ブルドーザーみたいなニコイチのほうがナンボかましだがそれも省電力的にやる意味がない デスクトップではTDP 65WのPL2を200W超まで拡大したんだから
下位SKUのコア数ならPコアだけで収まる、Eコアを積む意味がない
モバイルだとHのTDP 45WのPL2は115Wでしかないから
Eコアでマルチスレッドベンチをブーストする必要があるが デスクトップこそ膨大なマルチスレッド性能欲しいなぁ >>188
もっと遅いCPUでもSMT機能あったりするけどねえ
2スレッド/コア くらいなら有用と思うけどねえ >>193
Eコアの速度はPコアの仮想側に近いのでタイミングが取りやすいもあると思う
Eコアの仮想側はPコアのメインの1/10くらいの速度になるので。 Intel SGXの脆弱性問題、その後解決したの?
一部のCPUで再びSGXが搭載されるみたいなのだが CPUの「1コア2スレッド」が物理1コア仮想1コアでこの仮想1コアを「仮想側」と呼んでるんだろ
とエスパーしてみる
ちなみに上の解釈に正しい部分は何一つ無い
まあハードウェアの設計も知らないプログラムも書けない
ベンチマークだけ見て知ったような気になってる輩なんだろうな
どっちかだけでも知ってればこんな勘違いあり得ないから
(そもそもベンチマーク的にも間違ってるわけだが) >>197
専門家の方だ。
私は例えば映像を分析加工するのに自家用カスタムフィルタを必要に応じて作る程度で、マシン語は読み書きできない(brainf*ckくらいまで、)、くらいなんだけど、
実用上、論理コア数に合わせてスレッド分割すると終了時間にムラが出て速くならないことが多かったので
物理コア数に合わせて分割してたんだけど、
これは最適化以前の問題ってことでいいのかな。 >>198
CPUの話なんだからそんな高レイヤのソフトどうこうの話は関係ない
マシン語は読み書きできないけどプログラムは書けると主張するなら
「仮想側」だけに処理を割り当てて計測してみればいい 団子のトリップエクスプローラだっけ?
あれはSMTが全然聞かないくらい効率化されたプログラムだったな >>198
ド素人www
SMTに物理側、仮想側なんて区別は無い
(少なくともINTEL CPUには)
それから
均等に論理コア数で処理を分けても同時に終わらないのは当たり前
だから適宜処理を調整するのが普通
さらに
SMTが有効な処理であれば
処理量を適宜調整しなかったとしても
物理コア数じゃなく論理コア数分のスレッドにした方が速い
まとめると
>>198はド素人 >>202
ありがとう。処理を受け付ける入り口は対等に出来てて空いてるほうが割りつけってことね。
ちなみにその勘違いをしてたのは、画像処理など均等分割が簡単なのをやると処理速度が1/3くらいのスレッドがあることが多くて、
境界線のつなぎ合わせなど同期処理が必要な場合に困ることが多いからなんよね。
タイリングを細かくして割り付けを細かくすればいいというのはこのやり取りで学べた。ありがとう。 複数スレッドで近くのメモリにアクセスするのはキャッシュの観点から最悪
メモリ配置にも気を付けること
各スレッドの計算量が本当に同じで他より1/3しか出ないスレッドがあるなら
まずはメモリ配置を疑う >>202
物理コア数8コア8スレッド
論理コア数4コア8スレッド
論理コア数分のスレッドにした所で
物理コア数で負けてたら勝てないだろ? 普通はスレッドに対して論理コアは固定されない
処理中でもこまめに切り替わる データ分割と統合のバランスを考える必要はあるけど最大スレッド数よりも更に細かく分けると良いかも
先に処理を終えた所に次の処理を詰め込んで平均化出来る 無駄に細かく分けると切り替えのオーバーヘッドが問題となるしキャッシュ的にも不利
普通にスケジューリングすれば済む話
仕組みはいろいろとある そもそもSMTは効く場面が少ない上に効率が悪い
HTTだと0.25コア換算、AMDのSMTで0.30換算くらい
全く同じ処理振ったらそらボトルネックになるでしょ >>210
効率は非常に良い
微妙なトランジスタの増加で数十%マルチスレッド性能が上がるのだから
今後コアの演算器がさらに増えていけばさらに効果が大きくなる
素人が適当な事を言わないように >>210
x86しか知らんのだなぁ
SMTはAMDが起源ニダってか smtはそういう仕組みそのものの名称でHTは製品の機能の名称じゃないの その認識で正解
一般名称がSMT、Intel製品に組み込まれたSMTがHTT SMTはレジスタを2面持たせて、1(|2)面目
のパイプライン中のフォワーディング出来ない計算待ちや、メモリアクセス待ちの間に、2(|1)面の処理をする方式でしょ
演算器を増やさずにフル回転させて処理量を増やす
キャッシュデータの入れ替えあるけどキャッシュ先読みあるから、スレッドの多さで効率落ちるのは共通データの更新による影響でしょ フロント側が複数になるだけで
バック側はOoOとほぼ同じ
準備が出来た命令から実行するだけ >>212
3DMarkでのベンチマークスコア ハイパースレッディングon時はoff時より40%ほどスコアが高い
とぱっと調べたら出てきた。2019の頃の記事だけど。
4C8Tの結果らしいから1スレッド辺り10%程度のスコアアップなんだけど、
なにを動かせば非常に良い結果になるの?
無いより良い程度の結果だと思うけど。 5%のトランジスタ追加で最大40%のマルチスレッド性能向上で
ダイ面積あたり性能的に効率がいいって話を昔見た覚えがあるな
5%追加するだけで得られる結果としては非常に効率が良いと言っていいと思うが 良い結果になるのは
・並列化可能で負荷が重い処理
・メインメモリの帯域がクリティカルではない処理
・命令の依存関係やメモリレイテンシ、演算器(ポート)の偏りなどの影響で
演算器(ポート)が埋まりにくい処理 >>210
SMTを疑問視していたハイファを
ヒルズボロが納得させたらしいけど
どう説き伏せたんだろう 演算の依存関係を意識しない糞コードに対する性能アップが特に大きい
性能アップが大きいコードが必ず糞というわけではないが
糞の可能性は大きい 何を走らせるかで効率は変わるけど普通の処理なら少なくとも10〜20%くらいの性能は出るよ
どう見たって実装面積は10%もないから高効率 >>220
なるほどメインメモリへのアクセスが鍵と。
衒いなく文字通りの素人質問だけど、
分割は容易、分割後の内部は相互依存が多い、メインメモリへのアクセスが多い計算では、
同じMIPSなら低クロックで多コアな方が有利なのかな? 逆にメモリバンド幅がネックとなる数値計算では効果がないか微妙に遅くなるきともある。
バンド幅には問題なくてメモリレイテンシがネックとなる処理ならガンガン性能が出るんだが。 >>221
ハイファは純粋に技術的な観点で疑問視してたけど、ヒルスボロ?ポートランド?はマーケティング的なメリットで納得させたンじゃねーの。 TEAMGROUPは、RGB照明を備えた最初のDDR5メモリであるT-FORCE DELTA RGB DDR5 GAMING MEMORYを発売することにより、業界のパイオニアであり続けています。
このメモリでは、装備されている各RGBLEDライトを個別に色と速度をプログラムできます。DELTA RGB DDR5 GAMING MEMORYは、16GBまたは32GBの5,200MHzシングルチャネルメモリキットと、2X16GBまたは2X32GBのデュアルチャネルメモリキットを提供します。最新のIntelXMP3.0、ワンクリックオーバークロックテクノロジー、ECC機能をサポートし、
さまざまな照明制御ソフトウェアとの互換性テストのために、ASUS、ASRock、BIOSTAR、Gigabyte、MSIなどの主要なマザーボードメーカーにも送信されています。 。この新しいエキサイティングな製品は、2021年の第4四半期に購入できるようになります
https:///i.imgur.com/NDSX3fP.jpg
https:///youtu.be/23nnFyX_vxw AlderlakeはDDR4版マザーの互換どうなるかな?
キャッシュなどの小改良+eコア増量のRaptorlakeまではDDR4/5対応で続いてほしいが >>226 i9-7980XEやW-3175XでLinpackやy-cruncherのπ計算やると、帯域よりレイテンシ低い設定の方が速かったりする。
DDR4-3800 CL15-1T>DDR4 3600 CL15-1T>DDR4-4000 CL16-2T
現実的なプログラムではメモリ帯域ベンチ(バースト転送率95%以上とか)みたいのは少なくて、DDR5の内部2ch化は現実的な
アクセスパターンでの効果を狙っているのかな。
>>231 そいう意味じゃDDR5サポートしてるのにDDR5使わないのはもったいない気がする。 >>147
競争は大事だが競争維持のために買ってる訳じゃないからなー
今はインテル買えねえよ Alder爆熱だしやはりZen4が本命だな
EUV世代以外は買う気しないわ Zen4でもCPUチップレット1個のやつは
発熱厳しいかもしれんぞ
5800Xも厳しいらしいからな インテルがマザボメーカーに圧力をかけて、5800X感知時に電圧を高めにするようにしているらしいからな AMDのスレの方もそうだけどPenD時代のノリで煽ってるしょうもないおじさんがいるよな TDPと消費電力を混同してる奴まだ居るしな
年取って情報の更新が出来なくなるってこういう事かと思うよね CoreプロセッサーのTDPが4.5Wだった頃が懐かしい
あの頃はPCHやeDRAMも統合して
1W未満を目指すものとwktkしてた >>241
AMDがなければそういう未来もあったかもしれない
ここはAMDに対抗するために電源もりまくったルート >>241
ファンレスMacBook2015(Core M)とファンレスiPad 2014が同じ性能だったな
前者はすぐ熱だれするけど、、、
なお、MacBook2016と2017はだいたい10%ずつくらいの性能アップ
iPadは2015の時点で性能2倍で振り切った CPUアーキスレはカビの生えたコテハンが居座ってるからな >>241-242
それこそARMのシングルボードでええやん エリート/プレミアム厨でもありif厨(?)でもある。
カウンセリングが必要かもな。 >>239
> 同じTDP枠と発熱でどれだけ高性能を出せるかをAMDやIntelやAppleは競争してる
してるっけ?インテルなんかイチ抜けた!っていって我が道を行ってるだろ……
>>240
TDPと消費電力を混同してる年取ったおじいちゃんはいないだろう
おじいちゃんたちはまさにその世代だろ
自作をやり始めたばかりのキッズじゃないかそれは
おじいちゃんで多いのはTDPで止まってて、PL1, PL2やオペレーティングレンジのことを知らない人は結構いそう >>248
Intelの場合は「イチ抜けた!」ではなく「諦めた!」ではないだろうか イチ抜けしたのは競合他社より1年早くTSMCの最先端プロセスを使えるApple
来年以降もこの傾向が続く ここは自作版でデスクトップ用途がメインだからバッテリーが足枷となるモバイル用途と比較しても意味がないよ
A15もゲームを走らせればサマスロ起こしてフレームレート維持出来ないのは周知の事実だしどのメーカーも苦しんでるよ ネットワークに特化したIPUのMount Evansでシェア拡大を狙うインテル インテル CPUロードマップ
https://ascii.jp/elem/000/004/070/4070140/ >>250
誰も微細化の話なんかてしてないんだが
巣に帰れよ >>250
ところがalderはリークの数字を15W駆動可能な3.0GHzあたりに合わせるとM1と互角の数字になってしまう
まあ実物がでないと分からんけど、10nmで5nmと勝負になるかもしれんという。 >>255
実質5コアの3.2GHz M1(TDP 6W)に16コア3GHz(15W)で同等なのかよ、、
Zen3とM1のIPC差からして、Alderは少し差が縮むはずでは? >>256
15W版は2P+8Eしか出ないから、コア数とクロック両方合わせたときにM1とほほ同じになる
M1はA13(98.5mm2)より37%大きいとされるが、
alderのEコアは4つでPコアとほぼ同サイズで、2P+8Eはtigerの4コア(146.1mm2)と似たサイズになる
つまり両者とも140mm2前後似たサイズで、3.0GHzをちょっと超えるくらいでcinebench R23で7000点くらい、という算数になる
今まで出てる数字で、中学生レベルの比例計算の算数をすると、
10nmのintelと5nmのappleがほぼ同じダイサイズでほぼ同じ性能をほぼ同じ消費電力で達成するという謎現象が起きることになる。 消費電力は出てみるまで全くわからんな
通常通りならAlder Lake-P(15w)はPL2-55w動作で消費電力15Wとはほど遠い存在だから >>257
>次世代CPUはカセットカートリッジ方式になる。
Slot 1 Pentium2 時代にその道わ通ったかと(笑) >>260
E-COREで消費電力を落とせるなら、いつもどおりノートの方を先に出すでしょ
15-28Wクラスを出せなかったということはそういうこと。 >>260
tigerのときはcTDPが12-[15]-28Wで、公称15Wだけど実質28Wだろってツッコミがあったのだが
alderは12-[15]-20と20-[28]に分けられるのよね。上限28Wのほうは最大6P+8Eになるとされてる
なので2P+8Cはtigerの1165G7あたりより省電力にしたいらしい >>264
こうやってみるともうGoldenCoveコア2つでいい気がするな。つうかそうしないと電気食うばっかりだろ。
どうせP-Coreフルで回るのってシングル動作するときくらいだろ。マルチでわちゃわちゃ動く用に
E-Core大量に乗せとけ。 いっぱい乗せればいっぱいつおい
って世界じゃないんだよなぁ >>264
同じ条件(tiger-4C-UP3とalder-2P8E-P)でPL1-2-4が
tiger 28W-60W-105W
alder 15W-55W-123W
か
PL4は記事中の表記では最大10ナノ秒なので消費電力や発熱を見るならtigerより減少か 4c tigerが15Wで回るクロックは1.2GHzぐらいなんだが
プロセスも変わってないのにそんなに改善するのかね >>260
それな
可変TDP(15〜55W)と固定TDP(15W)と比較しても意味がない 核抑止力:デルはシミュレーション用に新しいIntel SapphireRapidsを出荷します
https://allinfo.space/2021/09/22/nuclear-deterrence-dell-ships-new-intel-sapphire-rapids-for-simulations/
デルは、2022年から核兵器のシミュレーションに使用される新しい米国のスーパーコンピュータ向けにSapphire Rapidsを搭載したIntelシステムを提供します。
システムは2025年までに継続的に拡張され、最終的に40PetaFLOPSのパフォーマンスを提供します。
デルは、新しいPowerEdgeサーバーを注文し、2022年半ばからIntel SapphireRapidsを搭載した最初のシステムを提供します。
これらはスケーリング用に設計する必要があり、1.5ペタフロップスのパフォーマンスを持つ小さなノードは2025年までに最大40ペタフロップスに拡張できるはずです。
全体として、エネルギー省の国家核安全保障局(DOE / NNSA)は3つの場所をアップグレードしています:ローレンスリバモア国立研究所(LLNL)、ロスアラモス国立研究所(LANL)、サンディア国立研究所(SNL)。 >>268
わいの1165G7ノートがすぐに100℃になってサーマルスロットリングになるから
100℃ギリギリまでクロック上げるクソ熱設計だとおもう ■ このスレッドは過去ログ倉庫に格納されています