>>629
その内容ならいくつか言える事が増えるね

まずVOBファイルの(というかVOBはMPEG-2 PSの別名みたいなもので)中身はおそらく映像がMPEG-2、音声も適当なコーデックで入ってる(これはMPEG-2 PSの規格で決まってる)
字幕は珍しい変わった形

つまりは音声を変換無しにコピー、映像に字幕を焼き付けて変換して任意のコンテナに入れてやれば良い
あなたのやり方はかなり遠回りじゃないかな
以下のやり方は試してないから後は何とかして

-analyzeduration 120M -probesize 120M
-ifo_palette 'VTS_01_0.IFO'
-i "concat:'VTS_01_1.VOB'|'VTS_01_2.VOB'|'VTS_01_1.VOB'|<……ある数だけ>"
-filter_complex '[0:1][0:4]overlay[outVideo]'
-map [outVideo] -codec:v <映像コーデック>
-map 0:2 -codec:a copy
'出力.<コンテナに合わせた拡張子>'

<VOBファイル>/VIDEO_TS/以下に各入力ファイルあるはず
フィルタと-mapのstream指定子で指定するstreamは自分で確認すること:https://qiita.com/k_maki/items/2145fd7a623283da786f

参考:https://qiita.com/blueknight611jp/items/4a5c8b162b85d6db0023