Webでの単語共起を調べるサイトを作った
2007-07-29-3
[Programming][NLP]
ヤフー検索を用いてWebでの単語共起を調べるサイト
「Web単語共起」(http://yapi.ta2o.net/tangokyouki/)
を作りました。
日本語だけじゃなく英語もいけますよ。
Yahoo!ウェブ検索APIで検索結果100件を取ってきて、
日本語の場合は形態素解析(MeCabを使用)をかけて、
単語の出現頻度をカウントして表示します。
Unigram は1語単位でのカウント、
Bigram は連続2語単位でのカウント、
Trigram は連続3語単位でのカウントを意味します。
「Web単語共起」(http://yapi.ta2o.net/tangokyouki/)
を作りました。
日本語だけじゃなく英語もいけますよ。
Yahoo!ウェブ検索APIで検索結果100件を取ってきて、
日本語の場合は形態素解析(MeCabを使用)をかけて、
単語の出現頻度をカウントして表示します。
Unigram は1語単位でのカウント、
Bigram は連続2語単位でのカウント、
Trigram は連続3語単位でのカウントを意味します。
この記事に言及しているこのブログ内の記事