日本語自然文検索機能 by goo
2005-10-04-2
[WebTool]
- 「goo」ウェブ検索サービスにおける日本語自然文検索機能の提供開始
について
<http://help.goo.ne.jp/info/n_release/n_05100401.html>
- goo、文章で検索できる「日本語自然文検索機能」を提供開始 :: SEM R
<http://www.sem-r.com/18/20051004210638.html>
「サラリーマンのお小遣いは平均いくらですか?」の意味を解釈して検索
すると…: <http://search.goo.ne.jp/web.jsp?TAB=&MT=%A5%B5%A5%E9
%A5%EA%A1%BC%A5%DE%A5%F3%A4%CE%A4%AA%BE%AE%B8%AF%A4%A4%A4%CF%CA
%BF%B6%D1%A4%A4%A4%AF%A4%E9%A4%C7%A4%B9%A4%AB%A1%A9&web4.x=49&
web4.y=13&MD=on>
検索結果は一見、検索会議3[2005-09-30-3]でデモした
"Hit0 Phrase Search" に見えなくもないですが、単なるAND検索ではなく、
構文解析や意味解析など深いことをやってて、精度も十分に高いのだと
思われます。
- 検索会議3デモ (2) Hit0 Phrase Search[2005-09-30-3]
追記051005:
プレスリリースに簡単な解説がありました。見落としていました。
<http://help.goo.ne.jp/info/n_release/n_05100401.html>
で一瞬ですね。単語が多いときは TF-IDF などでキーワード数絞れば済み
そうですし (ref. [2005-09-30-3]のデモ「KEYAPI」)。「適切と思われる
検索キーワードを生成し」というところが技術的なポイントですね。
高度なコンテキスト判定(分野・カテゴリ分類等)してるんでしょうね。
について
<http://help.goo.ne.jp/info/n_release/n_05100401.html>
- goo、文章で検索できる「日本語自然文検索機能」を提供開始 :: SEM R
<http://www.sem-r.com/18/20051004210638.html>
「サラリーマンのお小遣いは平均いくらですか?」の意味を解釈して検索
すると…: <http://search.goo.ne.jp/web.jsp?TAB=&MT=%A5%B5%A5%E9
%A5%EA%A1%BC%A5%DE%A5%F3%A4%CE%A4%AA%BE%AE%B8%AF%A4%A4%A4%CF%CA
%BF%B6%D1%A4%A4%A4%AF%A4%E9%A4%C7%A4%B9%A4%AB%A1%A9&web4.x=49&
web4.y=13&MD=on>
検索結果は一見、検索会議3[2005-09-30-3]でデモした
"Hit0 Phrase Search" に見えなくもないですが、単なるAND検索ではなく、
構文解析や意味解析など深いことをやってて、精度も十分に高いのだと
思われます。
- 検索会議3デモ (2) Hit0 Phrase Search[2005-09-30-3]
どこかからコピペしてきたすごく長い文をそのままYahooで検索しても
ヒットしないことが多いです。もしそうなったら、その文の中から名詞
だけ取り出してAND 検索(スペースで区切って検索)するというデモで
す。CGIでは、ローカルの形態素解析器を使って名詞抽出しています。
検索は Yahoo! API を使用しています。
追記051005:
プレスリリースに簡単な解説がありました。見落としていました。
<http://help.goo.ne.jp/info/n_release/n_05100401.html>
入力された文章は自動的に解析され、適切と思われる検索キーワードを0件のときになんとかしたいだけならば、それこそ「形態素解析+AND検索」
生成し検索を実行しています。これにより、適切な検索キーワードが思い
浮かばない場合や、検索結果が0件の場合でも、日本語自然文検索機能を
利用することで適切な検索結果を得られる可能性を高めることができます。
で一瞬ですね。単語が多いときは TF-IDF などでキーワード数絞れば済み
そうですし (ref. [2005-09-30-3]のデモ「KEYAPI」)。「適切と思われる
検索キーワードを生成し」というところが技術的なポイントですね。
高度なコンテキスト判定(分野・カテゴリ分類等)してるんでしょうね。