風来坊日記-日中翻訳 このページをアンテナに追加 RSSフィード

2006-12-20如何制作中文EPWING词典

今天尝试了一下如何自己制作Epwing词典,小结如下。

一. 准备软件介绍

1. Ebstudio ,epwing词典生成软件,最好是注册版。我这次用的是1.69。

2. c2epw02.exe,要安装版本,好生成需要的gaiji.xml、complex.xml、gaijimap.xml,生成的执行文件名为C2EPW.exe,需要在命令行下运行。

3. 中日对照txt术语文件。本来可用PDICunicode版本)的中日dic文件转换为Pdic一行格式,但此次我没转换成功,可能是版本(词典文件版本、pdic版本、OS版本)兼容问题。应该还是能解决的。

4. 英日对照格式txt术语文件。

5. 日文操作系统,主要是避免乱码和莫明其妙的问题。我用的虚拟的windows 98。并且安装好上述软件。

二. 制作英日epwing词典

1. 按Ebstudio要求准备text文档格式。我采用的是对照格式,这种资料最多,如果为一行格式或csv、其他trados、babylon、stardict格式的导出text文档,则需要相应处理,可利用宏。

PDICテキスト形式は、見出し 1行、説明文 1行の繰り返しで一つの項目を表します。

【例】

Automatic Data Acquisition

自動データ収集

Automatic Data Processing

自動データ処理

2. 打开Ebstudio,按步骤进行。

指定文件为准备好的text格式文件,选择pdic text形式。

其他按要求指定,选定各种index后执行。生成词典文件(两个,一个catalogs,一个词典文件)。将生成词典拷贝粘贴到EBWIN词典文件夹目录下。搜索例子图片如下。

日文检索

英文检索

词典information如下:

三. 制作中日epwing词典

1. 准备text文件。c2epw02.exe要求的格式为:

辞書をキスト形式に変換

1. 対応するファイル形式:

 PDIC一行テキスト形式(ただし、文字コードは、UTF-8)

  简体中文 /// 訳語部(ピンイン) \ 用例部(語義1) \ 語義2 \ ...

2. PDICU(ユニコード)の中国語辞書を、PDIC一行テキスト形式に変換する。

 Tools → 辞書の変換 → [転送元]PDIC形式 → [転送先]1行テキスト形式

設定はデフォルトのままとして変換・保存する。(見出し区切りは [░///░]、改行は [░\░]、登録項目は [訳語部+用例部]、デフォルトの出力コードは、UTF-16。ただし、"░"は、スペース。)

 (例)u16.txt

3. メモ帳(W2K, WXP)や秀丸エディタ等のユニコード対応のエディタで、UTF-16 → UTF-8へコードを変換し、名前を付けて保存し直す。

 (例)u8.txt

这里因为我转换pdic的dic词典文件为text格式未成功,所以自己另行制作了一行text文件,格式(词条和释义分隔符░///░、)、编码(UTF-8)按如上要求。

例子如下:(拼音用括号跟在词条后面,未注拼音的是我测试用的。)

良药 (liangyao) /// 良薬 /         

特效药(texiaoyao) /// 特効薬 /         

中药 (zhongyao) /// 漢方薬 /          

内服药 (neifuyao) /// 飲み薬 /          

外敷药 /// 塗り薬 /      

感冒药 /// 風薬(かぜやく) /          

退烧药(tuishaoyao) /// 解熱剤 /げねつざい  

镇痛药(zhitongyao) /// 鎮痛剤 /

EBSTUDIO可处理的pdic一行格式要求如下:

• DIC1行テキスト形式は、英単語、日本語訳、用例が一行で表される形式です。 PDIC以外に、PDA系の辞書検索ソフトで利用されている例があります。

【例】

英単語 /// 日本語訳 / 用例

• 英単語と日本語訳の区切りは /// (半角スペース+スラッシュ3つ+半角スペース)です。

• 日本語訳と用例の区切りは / (半角スペース+スラッシュ1つ+半角スペース)です。

• 日本語訳、用例には改行コードを含めることが出来ます。改行コードは \ (半角スペース+円マーク+半角スペース)です。なお、英単語には改行コードは使えません。

• /// の左側の文字列から、前方一致・後方一致・クロス検索インデックスを生成します。ただし、かな検索インデックスは作成できません。複合検索はPDICテキスト形式に準じます。

2. 按c2epw02.exe要求将text文件拷贝粘贴至与其同一文件夹内。在命令行模式下运行程序,生成html文件。

生成html文件内容例子如下:

外敷药

<塗り薬/      > Ⓤ

塗り薬/      塗り薬/      5916 6577 836F外敷葯

感冒药

<風薬/          > Ⓤ

風薬/          風薬/          611F 5192 836F感冒葯

退烧药

<tuishaoyao> Ⓤ

tuishaoyaotuishaoyao9000 70E7 836F退焼葯

镇痛药

< zhitongyao> Ⓤ

zhitongyao zhitongyao9547 75DB 836F鎮痛葯 ἃἂ

Ⓒ 良药 (liangyao) <良薬/         > [↑]

Ⓤ 826F 836F (006C 0069 0061 006E 0067 0079 0061 006F )

Ⓖ C1BC D2A9 (006C 0069 0061 006E 0067 0079 0061 006F )

Ⓙ 良葯 (liangyao)

ἃἂ

Ⓒ 特效药(texiaoyao) <特効薬/         > [↑]

Ⓤ 7279 6548 836F (0074 0065 0078 0069 0061 006F 0079 0061 006F )

Ⓖ CCD8 D0A7 D2A9 (0074 0065 0078 0069 0061 006F 0079 0061 006F )

Ⓙ 特效葯(texiaoyao)

3. 在ebstudio中输入文件选刚才生成的dic.html,字符定义文件和复合检索定义文件分别选择c2epw02.exe文件夹下的gaiji.xml、gaijimap.xml、complex.xml。

4. 选择输出路径,填好所需选项,执行。执行步骤记录可看log文件。

5. 生成了词典文件。

6. 测试结果如下:

指定できる検索語:

 ピンイン(声調有/無)、ユニコード(hex)、[互換]JIS漢字

用拼音进行搜索,在end、cross、auto模式下可以检索到。

用中文检索,只能在互换汉字下检索到,例如中可以,中药就不行(互换汉字?)。

日文检索,输入 “飲み薬”,可在front、auto、full等模式下检索到。

输入 薬 ,可在cross、auto等模式下搜索到。

四. 小结:

综上所述,英日、日英epwing词典的制作,主要是准备text文本花时间,其他没有什么困难。

中日词典还是要拼音检索,否则输入替换汉字检索会损失大量信息。而要给大量词条注拼音更是繁琐,不过也许可以用word的注音功能实现,有机会再尝试吧。(选择中文词条粘贴至word内,注音后另存text,调整格式,粘贴与日文释义合并?)

即使用拼音检索,也未实现在exact模式下检索,这对使用大量词典时是个问题。

VictoriaVictoria 2013/01/08 19:40 Now we know who the seisbnle one is here. Great post!

ゲスト



トラックバック - http://chinese.g.hatena.ne.jp/magiclee/20061220