人気ブログランキング | 話題のタグを見る
mytips.exblog.jp ブログトップ

chasen のインストール、詳細
OSXでのセットアップ
※なんにも考えないでセットアップしたら、
chasen: /usr/local/share/chasen/dic/ipadic/cforms.cha:9-21: no basic form
のようなエラーで動かない。


http://chasen.naist.jp/hiki/ChaSen/
ここから、最新版を落として解凍。
READMEや、PDFのマニュアルを読む。

「(システムに iconv がなければ) libiconv」
とあるので、OSXには含まれていないので、インストール

1)libiconvのインストール
cd /usr/local/src/
curl -O ftp://core.ring.gr.jp/pub/GNU/libiconv/libiconv-1.10.tar.gz
tar zxf libiconv-1.10.tar.gz
cd libiconv-1.10
./configure --with-libiconv=/usr/local
make
sudo make install



2)chasenのインストール
cd /usr/local/src/
curl -O http://chasen.aist-nara.ac.jp/stable/chasen/chasen-2.3.3.tar.gz
tar zxfv chasen-2.3.3.tar.gz
cd chasen-2.3.3
./configure --with-libiconv=yes
make
sudo make install


3)辞書を準備する
curl -O http://chasen.aist-nara.ac.jp/stable/ipadic/ipadic-2.6.3.tar.gz
tar vzxf ipadic-2.6.3.tar.gz
cd ipadic-2.6.3
./configure
make
sudo make install


4)辞書をchasenにセットアップする
ここ参考:http://pcweb.mycom.co.jp/column/yetanother/045/

まずは、3)の辞書をコピー
cd /usr/local/share/chasen/dic/ipadic(chasenの辞書のディレクトリに移動)
cp /usr/local/src/ipadic-2.6.3/*.dic . (ここへコピー)

*.dicと*.chaをUTF-8にnkfで変換が必要
下記シェルスクリプトをつくって、まとめて変換
----------------------
#!/bin/sh
for file in $*
do
if [ -f $file ]; then
nkf --utf8 $file > tmpfile
mv tmpfile $file
fi
done
exit
----------------------
conv_shell_scriptって名前にして、実行権限を付与して、実行。
./conv_shell_script *.dic
./conv_shell_script *.cha

辞書生成のコマンド実行(マニュアルにも載っています)
`chasen-config --mkchadic`/makemat -i w
sudo `chasen-config --mkchadic`/makeda -i w chadic *.dic
make install
最後に、設定ファイル/usr/local/etc/chasenrcもUTF-8に変換する。
# cd /usr/local/etc
# nkf --utf8 chasenrc > chasenrc.tmp
# mv chasenrc.tmp chasenrc

テストコマンド。
↓こんなの
echo "今回は「日本語」を扱う上で欠かせないツールを紹介しよう。" | chasen -i w

とか、UTF-8で保存したファイルを
chasen -i w chasen.test.txt
こんな感じ。
by sato025 | 2005-08-18 00:51 | Mac & Setup


by fd


var gaJsHost = (("https:" == doc ument.loc ation.protocol) ? "https://ssl." : "http://www.");doc ument.write(unesc ape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));var pageTracker = _gat._getTracker("UA-103429-5");pageTracker._trackPageview();