google様がサンプリング周波数16000HzのモノラルFLAC音源なら音声をテキスト化してやるよと仰るので仕方がないのです。