memo

2012-06-01

notmuch で日本語検索をいい感じにする

検索 & tag ベースのメーラー、 notmuch は、 内部で使っている全文検索エンジン xapian の都合で長らく日本語での検索が微妙だったのだけど、 xapian-core-1.2.8 から CJK 用に N-gram 方式に対応していたようだ。

今のところ、環境変数 XAPIAN_CJK_NGRAM に何か値がセットされている時のみ有効になるようなので、 変数を export した後データベースを作りなおす:

$ export XAPIAN_CJK_NGRAM=1
$ notmuch dump > ~/Maildir/.notmuch/dump-$(date +%Y%m%d)
$ mv ~/Maildir/.notmuch/xapian{,.old}
$ notmuch new
$ notmuch restore ~/Maildir/.notmuch/dump-$(date +%Y%m%d)

んで、たとえば 会社 で検索して 株式会社 が引っかかるようになったのを確認。

後は .zshrc なり .xprofile なりで環境変数をセットするように設定しておく。