古い記事
ランダムジャンプ
新しい記事
「Introduction to Information Retrieval」の輪講の第12回です。

- Introduction to Information Retrieval
http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

今回は初台のDeNAの会議室を使わせて頂きました。
ありがとうございました。
DeNA

最初に恒例の「前章の復習 by id:naoya」
(http://d.hatena.ne.jp/naoya/20080803/1217775535)。

そして、今回は第11章「Probablistic information retrieval」。
この章は、確率・統計の話がメインです。
これから後の章ではそういう話がいろいろと出てくるので基礎固め。

お知らせ:

ついに書籍版が出ました!
私はまだ未入手。来週にはゲットできるかと。

Introduction to Information Retrieval


関連情報:

- キーワード抽出: tf-idf の意味づけ (きまぐれ日記)
http://chasen.org/~taku/blog/archives/2005/11/_tfidf_1.html
tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。
確率と tfidf の話。

今日紹介した書籍:

Toby Segaran (著), 當山仁健, 鴨澤眞夫 (訳) / 集合知プログラミング

(ref. [2008-07-22-3])
ナイーブベイズや検索ランキングなど。

荒木雅弘 / フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで

(ref. [2007-10-09-4])
ベイズ判定法や統計的言語モデルなど。