「Introduction to Information Retrieval」輪講第17回
2008-12-07-2
[IIR]
「Introduction to Information Retrieval」の輪講の第17回です。
- Introduction to Information Retrieval
http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html
今回の場所は、六本木ヒルズの百度 (http://www.baidu.jp/) の
会議室を使わせて頂きました。ありがとうございます。
BAIDU! BAIDU!
今回の参加者は12名くらいでした。
恒例の復習プレゼンですが、しばらくお休みしていた
id:naoya 氏が輪講に復活したのですが、
いろいろと忙しいようで今回も無しでした。また近々!
今回の輪講は、第16章「Flat clustering」でした。
クラスタリングです。つまり、ドキュメントを
いくつかのクラスター(グループ)に分けちゃいます。
そういう手法の一つとして、
k-means というアルゴリズムを紹介しています。
これは重要!
とはいえ、実際に応用ソフト、ウェブサービスで使う上では、
クラスタに分けるだけではなく、各クラスタの名前(ラベリング)
を自動で適切につけないと使いものにならないのですが、
そこらへんについては次章でやるらしいです。
■Introduction to Information Retrieval
- Introduction to Information Retrieval
http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html
今回の場所は、六本木ヒルズの百度 (http://www.baidu.jp/) の
会議室を使わせて頂きました。ありがとうございます。
BAIDU! BAIDU!
今回の参加者は12名くらいでした。
恒例の復習プレゼンですが、しばらくお休みしていた
id:naoya 氏が輪講に復活したのですが、
いろいろと忙しいようで今回も無しでした。また近々!
今回の輪講は、第16章「Flat clustering」でした。
クラスタリングです。つまり、ドキュメントを
いくつかのクラスター(グループ)に分けちゃいます。
そういう手法の一つとして、
k-means というアルゴリズムを紹介しています。
これは重要!
とはいえ、実際に応用ソフト、ウェブサービスで使う上では、
クラスタに分けるだけではなく、各クラスタの名前(ラベリング)
を自動で適切につけないと使いものにならないのですが、
そこらへんについては次章でやるらしいです。
今回の内容に関係する書籍
■Introduction to Information Retrieval