古い記事
ランダムジャンプ
新しい記事
先日[2008-01-12-1]
「Introduction to Information Retrieval」[1]の輪講で、
第一章に出てきた "ad-hoc retrieval"(アドホック検索)を説明する際に、
ぐだぐだな感じになってしまったことを深く反省し、
改めてまとめてみました。

§

情報検索アルゴリズム」(共立出版)[2]によれば、
アドホック検索 (ad-hoc retrieval) とは、
「検索質問を短期的 (short-term) あるいは動的 (dynamic)、
文書集合を長期的 (long-term) あるいは静的 (static) なもの
としてとらえる情報検索」とのこと。また、これとは逆に、
短期的に更新(追加)されていく文書集合に対して、
長期的な検索質問で検索要求を満たすものだけを取り出すものが
情報フィルタリング (information filtering) だそうです。
ということで、
- 5分とかの短時間でいろいろな検索キーでウェブを検索して
  情報を集めるのはアドホック検索、
- ある検索キーでのウェブ検索結果を毎日チェックして
  新着がないか調べるのは情報フィルタリング、
と言えそうです。
「アドホック検索とは何か?」という質問には情報フィルタリング
の概念を持ち出して、それとの違いを中心に答えると分かりやすいですね。

IIR の後の方の章で出てきますが、
TREC という情報検索の性能を競うコンテスト形式のカンファレンス
(定期的に開催されています)があります。
TREC の中心的なコンテスト課題に、
ad hoc task (文書検索課題) と routing task (文書分類課題) があります。
前者は文書集合から検索質問に合う文書を取ってくる課題、
後者は文書集合の各文書が、複数ある検索質問のどれに合うか判定する
課題です[3]。
先の話に照らし合わせると、
ad hoc task がアドホック検索に、
routing task が情報フィルタリングにあたるかと思います。

参考文献:
[1] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schu"tze:
  Introduction to Information Retrieval, Cambridge University Press, 2008.
  (http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html)
[2] 北研二, 津田和彦, 獅々堀正幹: 情報検索アルゴリズム,
  共立出版, 2002.
[3] 徳永健伸: 情報検索と言語処理, 東京大学出版会, 1999.

(間違いや補足などありましたら下記フォームからご連絡頂けると幸いです)
この記事に言及しているこのブログ内の記事