Text::MeCabは導入が楽
2006-09-24-3
[Programming][NLP]
Text::MeCabはCPANに登録されているMeCabのPerlモジュール。
- Daisuke Maki / Text-MeCab-0.13 - search.cpan.org
http://search.cpan.org/~dmaki/Text-MeCab-0.13/
- きまぐれ日記: Text::MeCab が公開された
http://chasen.org/~taku/blog/archives/2006/05/textmecab.html
MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが手軽そうなので、サンプルプログラムに使おうかと。
インストール方法:
MaCab本体は事前にインストールしてあると仮定。
(取得はこちらから→ http://mecab.sourceforge.jp/)
使用例:MeCab.pmのサンプル[2006-02-25-4]をミニマム改変。EUC-JP。
- Daisuke Maki / Text-MeCab-0.13 - search.cpan.org
http://search.cpan.org/~dmaki/Text-MeCab-0.13/
- きまぐれ日記: Text::MeCab が公開された
http://chasen.org/~taku/blog/archives/2006/05/textmecab.html
MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが手軽そうなので、サンプルプログラムに使おうかと。
インストール方法:
MaCab本体は事前にインストールしてあると仮定。
(取得はこちらから→ http://mecab.sourceforge.jp/)
cpan -fi Text::MeCab
使用例:MeCab.pmのサンプル[2006-02-25-4]をミニマム改変。EUC-JP。
実行結果:use Text::MeCab; my $m = Text::MeCab->new(); my $str_euc = "今日もしないとね"; my $n = $m->parse($str_euc); while ($n = $n->next) { printf("%s\t%s\t%d\n", $n->surface, # 表層 $n->feature, # 現在の品詞 $n->cost # その形態素までのコスト ); }
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー 3848 も 助詞,係助詞,*,*,*,*,も,モ,モ 5145 し 動詞,自立,*,*,サ変・スル,未然形,する,シ,シ 10333 ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ 4386 と 助詞,接続助詞,*,*,*,*,と,ト,ト 5401 ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ 9129 BOS/EOS,*,*,*,*,*,*,*,* 8169
この記事に言及しているこのブログ内の記事