たつをの ChangeLog : 2008-07-08

ソーシャルネット的ログ解析&公開ツールとも言える、
Yahoo!ログール[2008-03-20-4]
「はてなダイアリー」でも使えるようになりました。

- iddyやpixiv、月刊剣道時代など全部で7つのブログパーツに
  対応いたしました (はてなダイアリー日記)
  http://d.hatena.ne.jp/hatenadiary/20080708/1215506707

これでヲハニュースで、閲覧者プロフィールなどがとれる!
と思ったが、たぶんヤフーID持っている読者は少ないかも…。

- Yahoo!ログール
http://logoole.yahoo.co.jp/
- ヤフーのログ解析ツール「Yahoo!ログール」[2008-03-20-4]
- ヲハニュース
http://d.hatena.ne.jp/yto/

Toby Segaran (著), 當山仁健, 鴨澤眞夫 (訳) / 集合知プログラミング


oreilly.co.jp -- Online Catalog: 集合知プログラミング
http://www.oreilly.co.jp/books/9784873113647/
機械学習のアルゴリズムと統計を使ってウェブのユーザが生み出した
膨大なデータを分析、解釈する方法を、基礎から分かりやすく解説します。
基礎から、ということで良さげ。
本書で紹介するのは「購入・レンタルした商品の情報を利用した推薦システム」、
「膨大なデータから類似したアイテムを発見し、クラスタリングする方法」、
「数多くの解決策の中から最適なものを探し出す方法」、
「オークションの最終価格を予想する方法」、
「カップルになりそうなペアを探す方法」、「遺伝的プログラミング」など。
いろいろと応用が利くネタが多いですね。私の仕事に関係するものも。
サンプルコードはPythonだそうです。で、
日本語版ではYahoo!日本語形態素解析Webサービスを利用した
日本語テキスト処理について加筆しました。
重要ですねえ。
日本語の場合は形態素解析して単語に分割しないと、
テキストマイニング系はほとんど何もできませんからね。
この記事に言及しているこのブログ内の記事

たつをの ChangeLog
Powered by chalow