Unicode対応の話さ、どうせなら辞書の形式ももっと標準的なものにしない?
俺はMS-IME,ATOK,Google日本語入力各種が採用している
「UTF-16(or UTF-8)で符号化されたタブ区切りのテキストファイル」がいいと思う。