UMA自体はデータ転送の無駄がなくて優れた方式だし、理想で言えばPCIeを通じた転送はない方がいい
コンシューマだとあまり問題にならないだけで、DCレベルのヘビーなワークロードだとCPU - GPU間の転送がボトルネックになって性能が発揮できないケースがある
MI300AがHBM3のユニファイドメモリを採用してるのも、GH200が専用のインターコネクトでデータ転送のボトルネックを回避してるのもそれが理由
apple siliconが問題なのは効率重視のパッケージにこだわり過ぎて性能がイマイチな上にスケーラビリティがクソなこと