Hatena::Groupchinese

妄言砂漠

2008-12-22

[] EBWinが独自のユーザ辞書作成可能に  EBWinが独自のユーザ辞書作成可能に - 妄言砂漠 を含むブックマーク はてなブックマーク -  EBWinが独自のユーザ辞書作成可能に - 妄言砂漠

d:id:huixingさんのところから。素晴らしい。英辞郎やPDIC用の辞書とEPWING辞書を串刺し検索できれば、調査作業の効率がぐぐぐっとアップするのは間違いありません。

PDIC用のデータや英辞郎データのインポートについては、PDICテキスト形式のファイルを添付のRubyスクリプトでSQLiteのデータベースに変換し、取り込む必要があるようです。Rubyの環境を整えないといけないので少々ハードル高し。このあたりもダイアログなどから簡単に変換できるようになるといいですね。今後の開発に期待です。

今晩にでもRubyの環境を整えて、変換→インポートを試してみたいと思います(´ω`)

追記:かなり手こずりましたが、北辞郎のファイルからユーザ辞書への変換に成功しました。近日中にまとめます(できれば明日。23:00を過ぎると私は廃人)。

PDIC→EBWinユーザ辞書への変換

huixingさんのところにPDICを使った方法が詳しく紹介してありますのでここに書くことは特にないのですが、Rubyをダウンロード・インストールし、ライブラリを入れ、バッチファイルをいじったり、Rubyのスクリプトをいじくった(こうした作業はまったく不要)自分を慰めるため、私が行った作業をまとめます。

以下、EBWin\support\EBDict\README.txtの内容を参考に行った作業概要です。

  1. Rubyインストール
  2. SQLite3-rubyのインストール
  3. sqlite.dllのコピペ
    1. ここでREADME.txtに「パスの通ったディレクトリにコピーする」と書いてありますがくじけてはななりません。C:\rubyRubyをインストールした場合、そのディレクトリにある「bin」に放り込んでおけば大丈夫だと思います。
  4. ここらで1回Windowsを再起動しておくと吉。
  5. 北辞郎から編集データ(PDIC用)を落として、EBDictフォルダに放り込む(EBWin\support\EBDict\kitajiro.txt)
  6. 北辞郎のデータはPDIC1行テキスト形式で文字コードがUTF-16なのでこれを直します。
    1. データをエディタで開いて「 /// 」を「\n」(改行)にすべて置換。「 \ 」を「<br>」にすべて置換。
    2. なお、これだけでは北辞郎で採用しているWiki風記法(+で番号つきリストやルビ記法など)には対応できてませんがとりあえず我慢(おい)。
    3. エディタで保存する際に、文字コードをUTF-8(BOMなし)にする。このへんはできないエディタも多いわけですが、EmEditorを使えば良いと思います。
  7. EBWin\support\EBDict\dict_load_pdic.rbを編集する
    1. 同ファイルの37行目に「line = line.kconv(Kconv::UTF8,Kconv::SJIS)」と書いてあるので、これをコメントアウトして(行頭に「#」を挿入する)上書き保存。
  8. EBWin\support\EBDict\make_pdic.batを編集する
    1. 「set TEXTFILE=.\PDEJ2005.TXT」を「set TEXTFILE=.\kitajiro.txt」に直す
    2. 「set EBDFILE=pdej2005.ebd」を「set EBDFILE=kitajiro.ebd」に直す
    3. 「set TITLE=PDEJ2005」を「set TITLE=Kitajiro」に直す
    4. 上書き保存
  9. 「kitajiro.txt」と「dict_load_pdic.rb」、「make_pdic.bat」が同じフォルダにあることを確認し、「make_pdic.bat」を実行(ダブルクリック)する。
    1. コマンドプロンプトが開くので後は電脳に任せる。ここで「rubyが有効なコマンドじゃない」などというメッセージが出るようなら1回Windowsを再起動する。
  10. kitajiro.ebdができたことを確認。これをEBWinに登録する。

ネット上に転がっている各種用語集をPDIC形式(単語\n訳語の形式)に整形し、EBWinに登録すれば一元管理できるので良さげです。ただ、上のRubyを使う方法はなかなか大変なのでPDICを使う方法がおすすめです。

[] Tclkit関連の覚え書き  Tclkit関連の覚え書き - 妄言砂漠 を含むブックマーク はてなブックマーク -  Tclkit関連の覚え書き - 妄言砂漠

いつもTclKit: bleeding-edge buildsに置いてあるtclkit855.exeを利用しているのですが、cp932やcp936などencodingの一部が含まれていないので追加する方法について覚え書き。

#まずtclkit855.exeをunwrapしてtclkit855.vfsにする
sdx.bat unwrap tclkit855.exe
#tclkit855.vfs/lib/tcl8.5/encodingに追加したいencodingをコピペする
#tclkit855.exeをmksplitする
sdx.bat mksplit tclkit855.exe
#tclkit855.exeをwrapし直す
sdx.bat wrap tclkit855.exe -writable -runtime tclkit855.head

以上。

参考:言葉の散歩

トラックバック - http://chinese.g.hatena.ne.jp/Ctrans/20081222