chasen のインストール、詳細
OSXでのセットアップ
※なんにも考えないでセットアップしたら、
chasen: /usr/local/share/chasen/dic/ipadic/cforms.cha:9-21: no basic form
のようなエラーで動かない。
http://chasen.naist.jp/hiki/ChaSen/
ここから、最新版を落として解凍。
READMEや、PDFのマニュアルを読む。
「(システムに iconv がなければ) libiconv」
とあるので、OSXには含まれていないので、インストール
1)libiconvのインストール
cd /usr/local/src/
curl -O ftp://core.ring.gr.jp/pub/GNU/libiconv/libiconv-1.10.tar.gz
tar zxf libiconv-1.10.tar.gz
cd libiconv-1.10
./configure --with-libiconv=/usr/local
make
sudo make install
2)chasenのインストール
cd /usr/local/src/
curl -O http://chasen.aist-nara.ac.jp/stable/chasen/chasen-2.3.3.tar.gz
tar zxfv chasen-2.3.3.tar.gz
cd chasen-2.3.3
./configure --with-libiconv=yes
make
sudo make install
3)辞書を準備する
curl -O http://chasen.aist-nara.ac.jp/stable/ipadic/ipadic-2.6.3.tar.gz
tar vzxf ipadic-2.6.3.tar.gz
cd ipadic-2.6.3
./configure
make
sudo make install
4)辞書をchasenにセットアップする
ここ参考:http://pcweb.mycom.co.jp/column/yetanother/045/
まずは、3)の辞書をコピー
cd /usr/local/share/chasen/dic/ipadic(chasenの辞書のディレクトリに移動)
cp /usr/local/src/ipadic-2.6.3/*.dic . (ここへコピー)
*.dicと*.chaをUTF-8にnkfで変換が必要
下記シェルスクリプトをつくって、まとめて変換
----------------------
#!/bin/sh
for file in $*
do
if [ -f $file ]; then
nkf --utf8 $file > tmpfile
mv tmpfile $file
fi
done
exit
----------------------
conv_shell_scriptって名前にして、実行権限を付与して、実行。
./conv_shell_script *.dic
./conv_shell_script *.cha
辞書生成のコマンド実行(マニュアルにも載っています)
`chasen-config --mkchadic`/makemat -i w
sudo `chasen-config --mkchadic`/makeda -i w chadic *.dic
make install
最後に、設定ファイル/usr/local/etc/chasenrcもUTF-8に変換する。
# cd /usr/local/etc
# nkf --utf8 chasenrc > chasenrc.tmp
# mv chasenrc.tmp chasenrc
テストコマンド。
↓こんなの
echo "今回は「日本語」を扱う上で欠かせないツールを紹介しよう。" | chasen -i w
とか、UTF-8で保存したファイルを
chasen -i w chasen.test.txt
こんな感じ。
※なんにも考えないでセットアップしたら、
chasen: /usr/local/share/chasen/dic/ipadic/cforms.cha:9-21: no basic form
のようなエラーで動かない。
http://chasen.naist.jp/hiki/ChaSen/
ここから、最新版を落として解凍。
READMEや、PDFのマニュアルを読む。
「(システムに iconv がなければ) libiconv」
とあるので、OSXには含まれていないので、インストール
1)libiconvのインストール
cd /usr/local/src/
curl -O ftp://core.ring.gr.jp/pub/GNU/libiconv/libiconv-1.10.tar.gz
tar zxf libiconv-1.10.tar.gz
cd libiconv-1.10
./configure --with-libiconv=/usr/local
make
sudo make install
2)chasenのインストール
cd /usr/local/src/
curl -O http://chasen.aist-nara.ac.jp/stable/chasen/chasen-2.3.3.tar.gz
tar zxfv chasen-2.3.3.tar.gz
cd chasen-2.3.3
./configure --with-libiconv=yes
make
sudo make install
3)辞書を準備する
curl -O http://chasen.aist-nara.ac.jp/stable/ipadic/ipadic-2.6.3.tar.gz
tar vzxf ipadic-2.6.3.tar.gz
cd ipadic-2.6.3
./configure
make
sudo make install
4)辞書をchasenにセットアップする
ここ参考:http://pcweb.mycom.co.jp/column/yetanother/045/
まずは、3)の辞書をコピー
cd /usr/local/share/chasen/dic/ipadic(chasenの辞書のディレクトリに移動)
cp /usr/local/src/ipadic-2.6.3/*.dic . (ここへコピー)
*.dicと*.chaをUTF-8にnkfで変換が必要
下記シェルスクリプトをつくって、まとめて変換
----------------------
#!/bin/sh
for file in $*
do
if [ -f $file ]; then
nkf --utf8 $file > tmpfile
mv tmpfile $file
fi
done
exit
----------------------
conv_shell_scriptって名前にして、実行権限を付与して、実行。
./conv_shell_script *.dic
./conv_shell_script *.cha
辞書生成のコマンド実行(マニュアルにも載っています)
`chasen-config --mkchadic`/makemat -i w
sudo `chasen-config --mkchadic`/makeda -i w chadic *.dic
make install
最後に、設定ファイル/usr/local/etc/chasenrcもUTF-8に変換する。
# cd /usr/local/etc
# nkf --utf8 chasenrc > chasenrc.tmp
# mv chasenrc.tmp chasenrc
テストコマンド。
↓こんなの
echo "今回は「日本語」を扱う上で欠かせないツールを紹介しよう。" | chasen -i w
とか、UTF-8で保存したファイルを
chasen -i w chasen.test.txt
こんな感じ。
by sato025
| 2005-08-18 00:51
| Mac & Setup