さくらの500円レンタルサーバで MeCab を使うための手順。
「MeCabをPerlから使う」[2006-02-25-4]を参考に。
MeCab は日本語形態素解析器です。
日本語文を単語に切り分けてくれます。
- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.net/
ソースの入手は上記 URL から。
まずは本体を入れなければ話になりません。
本体があっても辞書が無いと解析できないですからねえ。
バイナリの動作確認:
Perl で書く CGI スクリプトから使いたいので!
「/home/USERNAME/lib/perl5/site_perl/5.8.8/mach/」
に入った。
.zshrc で Perl のパスを追加:
動作確認スクリプト:
ちなみに Text::MeCab [2006-09-24-3]はテストで落ちたので
あきらめ。さようなら。
- さくらでMeCab PHP extension (Making The Road Blog)
http://makingx.net/blog/2007/08/02/
mecab-php-install-at-sakura/
- [を] さくらの500円レンタルサーバーで
SUFARY.pm を動かす[2008-08-20-3]
- [を] MeCabをPerlから使う[2006-02-25-4]
- [を] さくらのレンタルサーバ、三つ目[2008-08-23-1]
- [O] さくらサーバーにEmacsとScreenとZshとlvを入れる
http://overlasting.dyndns.org/2006-06-04-2.html
「MeCabをPerlから使う」[2006-02-25-4]を参考に。
MeCab は日本語形態素解析器です。
日本語文を単語に切り分けてくれます。
- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.net/
ソースの入手は上記 URL から。
MeCab 本体のインストール
まずは本体を入れなければ話になりません。
tar zxfv mecab-0.97.tar.gz cd mecab-0.97 ./configure --prefix=/home/USERNAME/opt make make cheack chmod a+x install-sh make install ~/opt/bin/mecab -h <== 簡単な動作確認
辞書のインストール
本体があっても辞書が無いと解析できないですからねえ。
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz cd mecab-ipadic-2.7.0-20070801 ./configure --prefix=/home/USERNAME/opt make make install
バイナリの動作確認:
% echo '鶏です' | nkf -We | ~/opt/bin/mecab | nkf -w 鶏 名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス EOS
Perlモジュールのインストール
Perl で書く CGI スクリプトから使いたいので!
tar zxvf mecab-perl-0.97.tar.gz cd mecab-perl-0.97 perl Makefile.PL PREFIX=/home/USERNAME make make test make install rsync -av blib/lib/ ~/lib/perl rsync -av blib/arch/auto ~/lib/perl/
「/home/USERNAME/lib/perl5/site_perl/5.8.8/mach/」
に入った。
.zshrc で Perl のパスを追加:
export PERL5LIB=$HOME/lib/perl:$HOME/lib/perl5/site_perl/5.8.8/mach/
動作確認スクリプト:
その実行結果:#!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use MeCab; binmode STDOUT, ":utf8"; my $m = new MeCab::Tagger (""); my $n = $m->parseToNode (encode('euc-jp', "美しい豚を食べた")); while ($n = $n->{next}) { print decode('euc-jp', "$n->{surface} $n->{feature} $n->{cost}\n"); }
美しい 形容詞,自立,*,*,形容詞・イ段,基本形,美しい,ウツクシイ,ウツクシイ 3862 豚 名詞,一般,*,*,*,*,豚,ブタ,ブタ 9952 を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 9142 食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ 13197 た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 10798 BOS/EOS,*,*,*,*,*,*,*,* 9688
ちなみに Text::MeCab [2006-09-24-3]はテストで落ちたので
あきらめ。さようなら。
perl -MCPAN -e 'install Text::MeCab'
参考
- さくらでMeCab PHP extension (Making The Road Blog)
http://makingx.net/blog/2007/08/02/
mecab-php-install-at-sakura/
- [を] さくらの500円レンタルサーバーで
SUFARY.pm を動かす[2008-08-20-3]
- [を] MeCabをPerlから使う[2006-02-25-4]
- [を] さくらのレンタルサーバ、三つ目[2008-08-23-1]
- [O] さくらサーバーにEmacsとScreenとZshとlvを入れる
http://overlasting.dyndns.org/2006-06-04-2.html