>>901
お前マジで頭悪いな
説明してやるからちゃんと読めよ

まずollamaだとVRAMからあふれたらメインメモリを使いだすんだわ
でこの時にGPUがPCIe経由でメインメモリを使いだすから遅くなる
この性能ペナルティは一番遅いPCIeの速度次第なので世代が新しくレーン数が多いほどペナルティが小さい
だからクソデカモデルを動かすときはPCIeレーン数が重要になる