11 件 見つかりました。
% echo 'ここは六本木ヒルズです' | mecapi.pl -format json -dic neologd | jq .
[
{
"feature": "名詞,代名詞,一般,*,*,*,ここ,ココ,ココ",
"surface": "ここ"
},
{
"feature": "助詞,係助詞,*,*,*,*,は,ハ,ワ",
"surface": "は"
},
{
"feature": "名詞,固有名詞,一般,*,*,*,六本木ヒルズ,ロッポンギヒルズ,ロッポンギヒルズ",
"surface": "六本木ヒルズ"
},
{
"feature": "助動詞,*,*,*,特殊・デス,基本形,です,デス,デス",
"surface": "です"
}
]
(JSON を扱うには jq がすごく便利!)curl https://maapi.net/apis/mecapi -s --data format=json --data-urlencode sentence=六本木ヒルズです
jq とはコマンドラインでJSONを扱う軽量プログラム。
MECAPIとは、 日本語形態素解析器 MeCab の Web Service (API) です。
API を無償で提供しております。
後述の注意点をお読みいただいた上で、ご自由にお使いください。
さくらのサーバーには既に、mecab本体、mecab-perl、ipa辞書が入っています。
use strict;
use warnings;
use MeCab;
my $m = new MeCab::Tagger ("");
while (<>) {
chomp;
my $n = $m->parseToNode($_);
while ($n = $n->{next}) {
print "$n->{surface} $n->{feature} $n->{cost}\n";
}
}
% echo "美しい豚を食べた" | nkf -e | perl5.14.4 mecab.pl | nkf -w 美しい 形容詞,自立,*,*,形容詞・イ段,基本形,美しい,ウツクシイ,ウツクシイ 3862 豚 名詞,一般,*,*,*,*,豚,ブタ,ブタ 9952 を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 9142 食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ 13197 た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 10798 BOS/EOS,*,*,*,*,*,*,*,* 9688
ヤフーの日本語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてき
た形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開す
るもの。
日本語文を形態素に分割し、品詞、読みがなの付与や、「文章内である
単語が何回使われたのか」といった統計情報を取ることができるWeb API。