当然ながら音声情報は1つずつしかインプットできない
視覚情報は複数同時に目に入る
文章の方が理解が早いのは当然ではある