たつをの ChangeLog
: 2008-07-22
前後の日:
2008-07-21
< >
2008-07-23
この月:
2008-07
別の年の同じ日:
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2015
2016
2017
2018
2019
2020
2022
2023
季菜(六本木)
2008-07-22-1 [
Restaurant
]
会社の飲み会でした。
研究所の所長(兼社長)も参加。
飲み過ぎたー、かも(またしても)。
場所は、六本木一丁目の「季菜」。
六本木 季菜
http://beneo-inc.co.jp/roppongi_kina/
http://www.ozmall.co.jp/restaurant/1033/dining.asp
筒のような個室が印象的でした。
両側の底にあたる部分が鏡なので、ものすごく深い筒に見えます。
つまり、ものすごく長いテーブルに。
「パターン認識と機械学習」を完全ゲット!
2008-07-22-2 [
Book
]
アマゾンで発注したものの
[2008-06-29-4]
、(アマゾンが)発送予定日になっても調達できなかったとのことで、発送が遅れに遅れていた「パターン認識と機械学習」の下巻がやっと届きました!
上巻、下巻がそろってコンプリート!です。
とりあえず、ご報告まで。
■
パターン認識と機械学習 下 - ベイズ理論による統計的予測
こちらが上巻:
■
パターン認識と機械学習 上 - ベイズ理論による統計的予測
輪講でもやりますかね、要望があれば。
いきなり脱落する人が多そうですが。
この記事に言及しているこのブログ内の記事
PRML副読本「パターン認識と機械学習の学習」 (2012-07-30)
「集合知プログラミング」をゲット!
2008-07-22-3 [
Book
][
NLP
]
絶対読まねば!
[2008-07-08-2]
、と書いていたら献本いただきました。
ありがとうございましたー!
■
Toby Segaran (著), 當山仁健, 鴨澤眞夫 (訳) / 集合知プログラミング
帯曰く、
ウェブのユーザが作り出す膨大なデータを
「機械学習のアルゴリズム」と「統計」で解釈する。
ざっと見た感じ、
IIR
の後半のネタもカバーしているようです。
濃さは違いますが。
あと、サンプルコードは Python ですが、これを Perl や Ruby に書き換えていくことで、内容が身に付いていきそうです。
- Programming Collective Intelligence
http://oreilly.com/catalog/9780596529321/
(サンプルコードはここからゲット!)
追記080724
: 馴染みのない Python ではまってしまったのでメモ。
第2章の実行サンプルで最初に「import recommendations」をやっておくとよいかと。
この記事に言及しているこのブログ内の記事
【これから読む本】入門ソーシャルデータ - データマイニング、分析、可視化のテクニック (2011-11-27)
「セマンティックWebプログラミング」を読んでみることに (2010-07-27)
インフォコモンズ (2009-10-16)
入門記事いろいろの「WEB+DB PRESS Vol.46」 (2008-08-20)
「Introduction to Information Retrieval」輪講第12回 (2008-08-03)
思考の飛躍を必要とする場面で役立つかもしれない「発想支援ナビ」を公開
2008-07-22-4 [
Release
]
関連ワードを簡単にブラウズでき、発想支援に役に立ちそうなサイト、「発想支援ナビ」を公開しました。
入力したワードの関連ワード(関連度に応じて文字サイズが変化)と、それらが使用される文脈(コンテキスト)を提示するサービスです。
どうぞご利用ください。
発想支援ナビ
http://navi.ta2o.net/
もうちょっと技術的な話:
- 関連語の取得は、Yahoo!の関連検索ワードAPIと、はてなブックマークのタグ別ページのRSSを元に行っています。
- 関連度計算に、Yahoo!ウェブ検索APIも用いています。
- Web検索APIによる検索結果XMLとはてブRSS中の日本語テキストに含まれる関連ワードをカウントし関連度としています。
- 関連度が高いほどフォントが大きくなるタグクラウド表示を採用。
「これって、どこかで見たことあるよなあ…」という方、なかなかするどい!
これは、昨年公開した
「
ヤフーは何かを知ろうとしている
」
[2007-02-14-1]
と
「
はてなは何かを知ろうとしている
」
[2007-08-04-2]
を
マージしたものなのです。
出所(Y!API、はてブ)ごとに別サイトにしても、「関連ワードの取得とブラウズ」という観点からはあまり意味がないので、この際いっしょにしました。
なお、 robots.txt を見て頂ければお分かりになると思いますが、「検索でヒットするページを増殖させて SEO でウマー」などというスパムまがいのことは考えておりません。
今後、CGM要素(または、オリジナル制作コンテンツ)を追加することがあれば robots.txt を書き換えるかも知れませんが。
また、サーバの負荷が上がると困るので、短時間での大量のスクレイピングは禁止します。
見つけ次第、アクセス拒否設定にします。
この記事に言及しているこのブログ内の記事
2008年にひとりで作ったネットサービス (2009-01-30)
前後の日:
2008-07-21
< >
2008-07-23
この月:
2008-07
別の年の同じ日:
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2015
2016
2017
2018
2019
2020
2022
2023
たつをの ChangeLog
Powered by
chalow