古い記事
ランダムジャンプ
新しい記事
「Introduction to Information Retrieval」の輪講の第11回です。

- Introduction to Information Retrieval
  http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

今回は東工大の大岡山キャンパスを使わせて頂きました。
ありがとうございました。
東工大

最初に恒例の「前章の復習 by id:naoya」
(http://d.hatena.ne.jp/naoya/20080721/1216655269)。

そして、メインは第10章「XML retrieval」輪講。
この章は、XML を代表とする構造化(or 反構造化)データに対する
効率的な検索アプローチの検討や実装などのお話です。
XML だから簡単!というわけにはいかない、という内容でした。
(例えば、パス+キーワードで検索する場合に、
パスの制約をどれだけ緩くするかで、タスクの大変さが変わってきます。
パスがマッチしてなくてキーワードのみマッチしたものの扱い方の
ポリシーについてなど、結構こまかいところが議論されています。)

輪講のあとは、XML 検索つながりで「瞬索の仕組みとその後」
というテーマでフリートークも。

さて次回から、確率の話がバシバシと出てきます。
この辺りは数式が多くて挫折しそうになってしまうかもしれませんが、
IT技術者として一歩先行くためには必須の技術要素です。
がんばりましょう!
(プログラム言語をもう一つ覚えるよりも確実に視野が広がります。
もちろん環境によりますけれどもね。)