ちなみに1m秒とかの精度を求めてるなら、音声自体も考えないと
発音は再生開始時にはまだ起こってない
波形が始まって有意な(人間の耳に認識できる)音になるまでに時間が経過してしまう
ということで、そんな精度で音を出す意味はあまりない