そこまでやってもRTXのミドルクラスあたりじゃないかな
RTXだと(モノにもよるが)CUDAコアだけで40topsくらいあってその上でTensorコアって奴が500topsとか1000topsあるとかないとか
実際画像生成とかやってみると生成速度に桁違いの性能差があるし