2ファイル以上の映像を並べるなら、pad, overlay よりも
v|hstack, または xstack を使ったほうがよい
https://ffmpeg.org/ffmpeg-filters.html#vstack
https://ffmpeg.org/ffmpeg-filters.html#hstack
https://ffmpeg.org/ffmpeg-filters.html#xstack
特に解像度が異なるときは xstack は便利
"xstack=inputs=2:layout=0_0|w0_0"