古い記事
ランダムジャンプ
新しい記事
「Introduction to Information Retrieval」の輪講の第七回です。

- Introduction to Information Retrieval
  http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

今回は六本木ヒルズ20Fの百度 (Baidu, http://www.baidu.jp/)
の会議室を使わせて頂きました。ありがとうございました。
Baidu

今回は第6章
「Scoring, term weighting & the vector space model」でした。
内容は、簡単な重み学習ロジック、TF-IDF などの指標、
そしてベクタースペースモデルの解説、ととっても濃い感じです。
この章を読み込むだけで、簡単な類似文書検索システム
(パフォーマンスは気にしない)が実装できるかと思います。

内容メモ:
- 最初に第5章の復習 by id:naoya
  http://d.hatena.ne.jp/naoya/20080517/1211032221
- ...
- TF, IDF, 正規化のバリエーション