>>9
> ORCA Project: 医療辞書
medic.txt
・読み:半角英数字/記号/全角ひらがな混在
・単語:全角英数字/記号/全角カタカナ/漢字混在
・文字エンコード:UTF-8
・改行コード:LF
これまでの辞書と異なり単語が全角文字になっている
0.5%ぱーとらんちゅうPB   0.5%パートラン注PB 10mL   名詞
読みを全角変換すると"."が不適切な文字になる
単語の英数字は半角が望ましいと思い以前手作業で変換していて諦めた(当時はexcel利用を思いつかなかった)