>>240
いや、出来れば4C共有でそのぶん演算機いっぱい積んだ方がいい
低クロックって事はマスター1clkあたりその半分しか捌けない、でもこの手の重演算はスループットこそ重要だけどレイテンシはあまり重視されない(とは言え本家GPUよりは大分良くなる)
下がったクロック分を数でカバーする
でもそうすると粒度の差で無駄が出てくる
そこで128x8とかx16とかいうアレイをあたかもSMTの様に回す手法として、CMT+SMTを使う
これならIOで詰まらない限りは良く回るし、前段後段に対するバランスの許容が大きい
幾ら多幅積んでもコア不釣り合いに大きいLSを装備するとなれば無駄が多い、だからそこを増やす手法としても有効

ただ、レイテンシの問題もあるユースとなった途端にクッソ遅くなるし、何より扱いにくい上に設計しにくい
難しい問題だわな