4倍精度が使われない理由は、直接ハードウエア回路で実行するマシンが少なくて、
ソフトでエミュレーションしているために、2倍精度演算よりも20倍とか30倍
計算に時間が掛かるから。そのため、うんと速度が落ちてしまうので、
4倍精度を使ったプログラム・アプリが書かれない。プログラム・アプリがないから
4倍精度の命令をハードで実装してもメリットがないので、4倍精度演算をハードで
実行する回路を持ったCPU・計算機が作られない。するとそのような計算機の
上で4倍精度演算をソフトエミュレートで実行すると20倍〜30倍遅いので、
プログラム・アプリが書かれない。プログラム・アプリがないから4倍精度の
命令をハードで実装してもメリットがないので、4倍精度演算をハードで
実行する回路を持ったCPU・計算機が作られない。。。悪循環。

でもIBMの最近のサーバー用CPUであるPower9には、
4倍精度の演算回路が内蔵されているんだよ。

そもそも2倍精度の演算を行うとき、たとえば乗算を行う場合には、
2倍精度の仮数部と2倍精度の仮数部をかけ算するとき、内部では
ほぼ4倍精度並の長さの積の仮数部が作られている。その積の計算を
作る段階では4倍精度並の加算も回路としては必要だ。
そうやって、いったん内部で128ビットFPまがいの仮数部を作っておいて
それから「正確な丸め」を行ってわざわざ仮数部を丸めてFP64に
しているんだ。だから回路的にはそうとうもったいないことをしている
わけだ。丸めずにそのままIEEEには規定されていないが中間形式の
FPとしてレジスタに結果を入れられたり、そういった数をFMA的に
足し算できるようにすれば、長い倍精度のベクトル同士の内積計算などで
項数が多いことから来る積み残し誤差とか、数値相殺による相対精度の
低下などの影響を大いに減らすことができるのに。
ばかみたいにIEEEのFPの仕様に忠実に作ってしまうので、数値計算
にとってわずかな改変で結果を素晴らしく良くできる可能性をドブに
棄てているんだ。そもそものIEEEのFPはFMA命令ですらなくて、
FMA命令を使うとIEEEの規定する乗算や加算と結果が異なるので
「悪い」などといった馬鹿げた意見が世の中を支配していたりもした。
 数値計算に十分な理解が無いハード寄りの人間ほど、規格が
どうであれそれを墨守して作りたがる。
かつてのIBMの16進FPは、Kなどの馬鹿が採用したもので、
丸め誤差などの問題には無頓着で、単に表せる数値のレンジを広げて、
加算を仮数部を4ビットずつずらしてシフトして行えるので、加算の
演算速度が25%向上するという利点に目がくらんで採用したもの
だった。