:date: 2004-04-23 23:54:44
:tags: Zope, Memo
=======================================
COREblogにおける日本語の問題
=======================================
`COREblog `__ は標準では検索機能が使えません。 `HowTo `__ に使えるようにするための手順は載っていますが、それだけでは日本語の検索がうまくいきません。原因はパーサーが日本語をパース出来ないところにあります。(自分の環境固有の話かもしれませんが‥‥)
.. :extend type: text/plain
.. :extend:
そこで、 `mojix `_ 氏作の `MJSplitter `_ を導入します。このプロタクトは、形態素解析器 `MeCab `_ を用いて日本語を解析し、カタログ化するZCTextIndexのパーサーとして機能します。
MJSplitter_ を手順に従ってインストールすると、ZCTextIndexのWord SplitterとしてMJSplistterを選択できるようになります。COREblogフォルダのcontentsタブでlexiconオブジェクトを削除して、lexiconという名前でZCTextIndexを追加後、EntryタブでRecatalogすると日本語を含むカタログが生成されます。
自分の環境は以下ような感じです。
- UTF-8
- `Zope2.7.0 `__
- `COREblog0.61b `__
- `MeCab0.76 `__
- `ipadic2.5.1 `__
- `MeCab-python-bindings0.76 `__
- `JapaneseCodec1.4.10 `__