Text::MeCabは導入が楽
2006-09-24-3
[Programming][NLP]
Text::MeCabはCPANに登録されているMeCabのPerlモジュール。
- Daisuke Maki / Text-MeCab-0.13 - search.cpan.org
http://search.cpan.org/~dmaki/Text-MeCab-0.13/
- きまぐれ日記: Text::MeCab が公開された
http://chasen.org/~taku/blog/archives/2006/05/textmecab.html
MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが手軽そうなので、サンプルプログラムに使おうかと。
インストール方法:
MaCab本体は事前にインストールしてあると仮定。
(取得はこちらから→ http://mecab.sourceforge.jp/)
使用例:MeCab.pmのサンプル[2006-02-25-4]をミニマム改変。EUC-JP。
- Daisuke Maki / Text-MeCab-0.13 - search.cpan.org
http://search.cpan.org/~dmaki/Text-MeCab-0.13/
- きまぐれ日記: Text::MeCab が公開された
http://chasen.org/~taku/blog/archives/2006/05/textmecab.html
MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが手軽そうなので、サンプルプログラムに使おうかと。
インストール方法:
MaCab本体は事前にインストールしてあると仮定。
(取得はこちらから→ http://mecab.sourceforge.jp/)
cpan -fi Text::MeCab
使用例:MeCab.pmのサンプル[2006-02-25-4]をミニマム改変。EUC-JP。
use Text::MeCab;
my $m = Text::MeCab->new();
my $str_euc = "今日もしないとね";
my $n = $m->parse($str_euc);
while ($n = $n->next) {
printf("%s\t%s\t%d\n",
$n->surface, # 表層
$n->feature, # 現在の品詞
$n->cost # その形態素までのコスト
);
}
実行結果:
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー 3848
も 助詞,係助詞,*,*,*,*,も,モ,モ 5145
し 動詞,自立,*,*,サ変・スル,未然形,する,シ,シ 10333
ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ 4386
と 助詞,接続助詞,*,*,*,*,と,ト,ト 5401
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ 9129
BOS/EOS,*,*,*,*,*,*,*,* 8169
この記事に言及しているこのブログ内の記事
