« Toodledoのフォルダとタグの使い分け | トップページ | ToodledoのToDoデータの保存 »

2009.03.11

ATOKユーザ辞書の整理

先日,pomeraのATOK辞書の登録可能語数を増やしてほしいということを書きました。その際,ATOKユーザ辞書の整理を行ったことも触れました。

実はMacを使いはじめた頃からATOKを使っており,確かATOK8でしたが,現在ATOK2008(バージョンを見たら“21”!だそうです)となっています。

現在いたるまで,ユーザ辞書は引き継ぎ,引き継ぎ利用してきました。ジャストシステムに限らず,IMを作っているメーカーは,使用者の言葉づかいの癖などを学習させることで変換効率を上げようと考えているのでしょうから,前のバージョンからデータを引き継ぐということはまったく誤っていませんし,少なくとも固有名詞をまた一から学習させるなどという労苦は必要ありません。

しかし,ATOKは必要以上に学習をしてくれているようで,変な変換結果(例えば,助詞からはじまる変換など)や誤変換などもしっかりと学習してユーザ辞書に登録してくれます。そのうえ,これは私が悪いのですが,どこかの段階で(といってもかなり昔の話ですが……)ユーザ辞書を合併する際に,「自動登録単語を登録単語として合併」のオプションを有効にしていたようです。

そのせいかどうかはわかりませんが,このところ変換効率が悪くなってきているように感じました。そこで,思い切ってユーザ辞書の登録単語を整理することにしました。

ATOK2008から辞書ユーティリティが非常に使いやすくなりましたので,手作業で確認していく作業もそれほど大変ではありませんでした。作業の方針は以下のとおりでした。

  • 自動登録単語のうち,登録単語に変更すべきものを変更したうえで,それ以外のものを削除する。

  • 登録単語のうち,必要のないもの(ここ数年変換に用いた記憶がないもの)を削除する。

  • 登録単語のうち,表記の統一を必要とするものを「自動置換」と「コメント」機能を用いて統一する。
    例えば,「らんちゃ」と打ち込んで,「ランチャー」と自動置換するようなイメージです。これをしておくと作成した文書を後で見直す際の手間を省くことができます。

  • これまで自動登録単語に依存してきたカッコ付き数字などを数詞として登録する。あわせて年号と西暦どちらからでも変換できるように登録しておく。

数日に分けてこの作業を行いました。なぜか「ん」からはじめていきましたが,その理由は私自身もわかりません (^_^;

その結果,ファイルサイズがおおよそ20%程度削減されました。語数はほぼ50%程度削除したにもかかわらず,このファイルサイズはあまり効率的とはいえませんが,「自動置換」などの機能を用いたからでしょう。

この作業を一度しておくと,今度は時間があるときに自動登録単語だけを検索し,必要なものを登録し,後は削除するという作業を続けるだけで,ユーザ辞書がどんどん鍛えられていきます。

今回この作業を行った結果,体感では変換効率がかなり向上したと思います。

まあ,うまく変換できなくてイライラすることを思えば,ちょっとした時間をつかってユーザ辞書を整理したのは正解だったと思います。

|

« Toodledoのフォルダとタグの使い分け | トップページ | ToodledoのToDoデータの保存 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/9082/44275941

この記事へのトラックバック一覧です: ATOKユーザ辞書の整理:

« Toodledoのフォルダとタグの使い分け | トップページ | ToodledoのToDoデータの保存 »