古い記事
ランダムジャンプ
新しい記事
さくらの500円レンタルサーバで MeCab を使うための手順。
「MeCabをPerlから使う」[2006-02-25-4]を参考に。

MeCab は日本語形態素解析器です。
日本語文を単語に切り分けてくれます。

- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.net/

ソースの入手は上記 URL から。

MeCab 本体のインストール


まずは本体を入れなければ話になりません。

tar zxfv mecab-0.97.tar.gz
cd mecab-0.97
./configure --prefix=/home/USERNAME/opt
make
make cheack
chmod a+x install-sh
make install
~/opt/bin/mecab -h <== 簡単な動作確認

辞書のインストール


本体があっても辞書が無いと解析できないですからねえ。

tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --prefix=/home/USERNAME/opt
make
make install

バイナリの動作確認:
% echo '鶏です' | nkf -We | ~/opt/bin/mecab | nkf -w
鶏      名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ
です    助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
EOS

Perlモジュールのインストール


Perl で書く CGI スクリプトから使いたいので!

tar zxvf mecab-perl-0.97.tar.gz
cd mecab-perl-0.97
perl Makefile.PL PREFIX=/home/USERNAME
make
make test
make install
rsync -av blib/lib/ ~/lib/perl 
rsync -av blib/arch/auto ~/lib/perl/

「/home/USERNAME/lib/perl5/site_perl/5.8.8/mach/」
に入った。
.zshrc で Perl のパスを追加:
export PERL5LIB=$HOME/lib/perl:$HOME/lib/perl5/site_perl/5.8.8/mach/

動作確認スクリプト:
#!/usr/bin/perl
use strict;
use warnings;
use utf8;
use Encode;
use MeCab;
binmode STDOUT, ":utf8";
my $m = new MeCab::Tagger ("");
my $n = $m->parseToNode (encode('euc-jp', "美しい豚を食べた"));
while ($n = $n->{next}) {
    print decode('euc-jp',
         "$n->{surface} $n->{feature} $n->{cost}\n");
}
その実行結果:
美しい 形容詞,自立,*,*,形容詞・イ段,基本形,美しい,ウツクシイ,ウツクシイ 3862
豚 名詞,一般,*,*,*,*,豚,ブタ,ブタ 9952
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 9142
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ 13197
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 10798
 BOS/EOS,*,*,*,*,*,*,*,* 9688

ちなみに Text::MeCab [2006-09-24-3]はテストで落ちたので
あきらめ。さようなら。
perl -MCPAN -e 'install Text::MeCab'

参考


- さくらでMeCab PHP extension (Making The Road Blog)
  http://makingx.net/blog/2007/08/02/
  mecab-php-install-at-sakura/


- [を] さくらの500円レンタルサーバーで
  SUFARY.pm を動かす[2008-08-20-3]

- [を] MeCabをPerlから使う[2006-02-25-4]

- [を] さくらのレンタルサーバ、三つ目[2008-08-23-1]

- [O] さくらサーバーにEmacsとScreenとZshとlvを入れる
  http://overlasting.dyndns.org/2006-06-04-2.html