diacritics:(発音記号付き英字にマッチ)オプション無しだと
濁点や英語の発音記号あたりのUnicode結合文字部分は無視されるはず