質問です

ひらがなとカタカナの長音記号って、データで区別はされていないの?
「にゃー」と「ニャー」の「ー」の部分です。


それと関連して、
書類で正規表現検索で、カタカナの単語だけを全部検索したいです。
とりあえず「[ァ-ン]|ー」で一文字ずつ検索しているけど、
文字数にかかわらず、ひとまとまりの単語ごとに検索でヒットさせる正規表現ありますか?
だれか教えて。よろしくお願いします。