Lac Viet 辞書を PDIC 形式に変換

Lac Viet は英語とベトナム語の間の辞書である。現在、パソコン上で利用できる辞書の中ではもっとも良質な辞書じゃないかと思う。(私の知る限り) 一方 PDIC はいろんな辞書コンテンツを載せて動かすことができる汎用辞書ソフトウェアである。LacViet の閲覧ソフトウェアが使いづらいので、この辞書コンテンツを PDIC 形式に変換して、PDIC 上で動かすようにした。(いろいろ欠落したエントリ等があり、完全な移行はできなかったのだが)

基本的には、Triple 9 でパソコンを自動操作して、Lac Viet のすべてのエントリをリッチテキストファイル上にコピーして、それを RubyスクリプトPDIC 形式に変換するという方法である。言語に尽くしがたい面倒がいろいろあった。特に、LacViet がリッチテキストファイルにコピーされたときに文字コード体系が、UTF-16 +Unicode Combining Characters という構成なのにハマリまくった。Unicode Combining Characters というのは、アクセント記号を独立の文字として扱う方法である。

変換の詳細を知りたい方が(万が一)いらっしゃったら eijisakai@gmail.com までメールしてください。