たつをの ChangeLog : 2008-07-22

会社の飲み会でした。
研究所の所長(兼社長)も参加。
飲み過ぎたー、かも(またしても)。

場所は、六本木一丁目の「季菜」。

六本木 季菜
http://beneo-inc.co.jp/roppongi_kina/
http://www.ozmall.co.jp/restaurant/1033/dining.asp

季菜

筒のような個室が印象的でした。
両側の底にあたる部分が鏡なので、ものすごく深い筒に見えます。
つまり、ものすごく長いテーブルに。

アマゾンで発注したものの[2008-06-29-4]、(アマゾンが)発送予定日になっても調達できなかったとのことで、発送が遅れに遅れていた「パターン認識と機械学習」の下巻がやっと届きました!
上巻、下巻がそろってコンプリート!です。
パターン認識と機械学習

とりあえず、ご報告まで。

パターン認識と機械学習 下 - ベイズ理論による統計的予測


こちらが上巻:

パターン認識と機械学習 上 - ベイズ理論による統計的予測


輪講でもやりますかね、要望があれば。
いきなり脱落する人が多そうですが。
この記事に言及しているこのブログ内の記事

絶対読まねば![2008-07-08-2]、と書いていたら献本いただきました。
ありがとうございましたー!
集合知プログラミング

Toby Segaran (著), 當山仁健, 鴨澤眞夫 (訳) / 集合知プログラミング


帯曰く、
ウェブのユーザが作り出す膨大なデータを
「機械学習のアルゴリズム」と「統計」で解釈する。

ざっと見た感じ、IIRの後半のネタもカバーしているようです。
濃さは違いますが。

あと、サンプルコードは Python ですが、これを Perl や Ruby に書き換えていくことで、内容が身に付いていきそうです。

- Programming Collective Intelligence
http://oreilly.com/catalog/9780596529321/
(サンプルコードはここからゲット!)

追記080724: 馴染みのない Python ではまってしまったのでメモ。
第2章の実行サンプルで最初に「import recommendations」をやっておくとよいかと。

関連ワードを簡単にブラウズでき、発想支援に役に立ちそうなサイト、「発想支援ナビ」を公開しました。
入力したワードの関連ワード(関連度に応じて文字サイズが変化)と、それらが使用される文脈(コンテキスト)を提示するサービスです。
どうぞご利用ください。

発想支援ナビ
http://navi.ta2o.net/
発想支援ナビ

もうちょっと技術的な話:
- 関連語の取得は、Yahoo!の関連検索ワードAPIと、はてなブックマークのタグ別ページのRSSを元に行っています。
- 関連度計算に、Yahoo!ウェブ検索APIも用いています。
- Web検索APIによる検索結果XMLとはてブRSS中の日本語テキストに含まれる関連ワードをカウントし関連度としています。
- 関連度が高いほどフォントが大きくなるタグクラウド表示を採用。

「これって、どこかで見たことあるよなあ…」という方、なかなかするどい!
これは、昨年公開した
ヤフーは何かを知ろうとしている[2007-02-14-1]
はてなは何かを知ろうとしている[2007-08-04-2]
マージしたものなのです。
出所(Y!API、はてブ)ごとに別サイトにしても、「関連ワードの取得とブラウズ」という観点からはあまり意味がないので、この際いっしょにしました。

なお、 robots.txt を見て頂ければお分かりになると思いますが、「検索でヒットするページを増殖させて SEO でウマー」などというスパムまがいのことは考えておりません。
今後、CGM要素(または、オリジナル制作コンテンツ)を追加することがあれば robots.txt を書き換えるかも知れませんが。
また、サーバの負荷が上がると困るので、短時間での大量のスクレイピングは禁止します。
見つけ次第、アクセス拒否設定にします。
この記事に言及しているこのブログ内の記事

たつをの ChangeLog
Powered by chalow