たつをの ChangeLog : 2005-05-27

Blog Hackers Conference 2005
<http://hacks.bloghackers.net/archives/2005/05/blog_hackers_co_1.html>
<http://www.oreilly.co.jp/editors/archives/000049.html>
日時2005/05/27 (Fri) 19:00 - 21:00
会場デジハリ東京御茶ノ水本校

行ってきました!
IMGIMG
(last update 2005-06-02 23:00)


■著者スピーチ

miyagawa
miyagawa : <http://blog.bulknews.net/mt/archives/001715.html>
Folksonomyやスパムの話。画像の扱いがキーになるとのこと。スパム対策
もいろいろ。ちなみにうちは特定に日付のコメント欄にスパムが集中して
来るのでそこだけ書き込めないようにする、という対策で今のところOK。

naoya
naoya <http://d.hatena.ne.jp/naoya/20050528/1117236566>:
ブログ終焉説の終焉とWeb2.0的。はてなで自分の思うがままに腕を振るっ
てるのが楽しそう。最近はてなは機能的に洗練されてきて良い感じになっ
てきてますよね。

■Lightning Talk

私以外の写真はなんとなくモザイクにしてみました!謎めいた感じ!
発表者の方で写真データ欲しい方はご連絡を。

関村
関村昌義 <http://qootas.org/archives/2005/05/blog_hackers_co.html>:
del.icio.us のお話。デリシャス生活。私は最近は「はてなブックマーク」
一本だなあ。ともかく、もはやSBSのない生活は考えられん!

たつを
山下たつを:
私の発表は後述。

橋本
橋本大也 <http://www.ringolab.com/note/daiya/archives/003449.html>:
自分で作ったRSS監視ツールで、意外なことが判明した!という愉快なお
話。ふと思ったんだけど、私は結構 Blog 記事を書き換えたりすることが
多いので、こういうツールでストックしつづけるとバージョン管理みたい
のができるかも。自動でやってくれないと面倒だしな。

近藤
近藤淳也 <http://d.hatena.ne.jp/jkondo/>:
近藤=「日本人にはBlogより日記!」、というのが定着して困るというお
話。最近のはてなはブログっぽくもある、とデータで証明。
あとはてなTシャルのプレゼント!最後にじゃんけん大会で。
そういえば、せっかく「SPAM」Tシャツを着て行ったのだが、ツッコミが
1件しかなくてがっかり。
減塩スパム(SPAM)

Yappo
Yappo <http://blog.yappo.jp/yappo/archives/000241.html>:
Blogなどのツールに組み込むことを前提とした検索エンジンのお話。
最近 Inverted Index のフリーの検索エンジンがどんどん出てきておもし
ろくなってきてる。Hyper Estraier, Senna, Rast。参考になりますー。
そういえば、SUFARY <http://ta2o.net/tools/sufary/> ももともと
Cライブラリがメインなので組み込み用途と言えるかも!

小鳥ピヨピヨ
小鳥ピヨピヨ <http://coolsummer.typepad.com/kotori/>:
投稿募集「こんなHackなら、しないほうがマシだ」
<http://coolsummer.typepad.com/kotori/2005/05/hack.html>。
笑える! 個人的には ma.la さんの投稿した「地震情報と連動してブラウ
ザがゆれる」というネタがお気に入り。
ところで、28日にアップされてた記事「モダシンとデジハリ校長は激似」
<http://coolsummer.typepad.com/kotori/2005/05/post_10.html>
を読んで霧が晴れました。モダシンさんと初めてお会いしたのですが、
「うーん、なんか誰かに似てるよなー」とずっと心の中でひっかかってい
たのです!

南野
南野朋之 <http://lrlab.dyndns.org/archives/002325.html>:
blogWatcher <http://www.lr.pi.titech.ac.jp/blogwatcher/> で有名。
なんでもRSSの超簡易版プレゼンです。かなりポイントをしぼって分かり
やすかったと思います。 ref. [2004-04-18-3]
(ブログ記事に論文へのリンクもあると良いと思うぞ)

にぽたん
にぽたん <http://blog.livedoor.jp/nipotan/archives/23404481.html>:
某ブログサービスの内情。ドラマは見たことないのですが、この記事
<http://blog.livedoor.jp/nipotan/archives/19009730.html> を読んで
たので話についていけました!

ooba
ooba <http://www.bricklife.com/weblog/000621.html>:
ポイントを付箋みたいので隠すという「もんたメソッド」。良すぎ!
あと Ajax なツリービューは良さげです。
あ、「Ajaxによる文字化け検証結果」という表がアップされてる!
うーむ、safari だと XmlHttpRequest で text だめなのか。

宮川
最後はまた miyagawa 氏。キーワードがわらわらするデモ。

■その後:

終わったあとは飲み会でした。って、私(パシリ)が店探してきた。
飲み会飲み会
終電で帰ることができました。ツイてる!

■私の Lightning Talk の発表内容:

Lightning Talk で以下の内容で発表しました。
- タイトル:ブログでアサマシマイニング
- 概要:自分のブログで紹介したAmazonアソシエイトによる商品の
  注文状況を統計的に解析し、データマイニングするという
  「アサマシマイニング」について。
- 発表資料: http://chalow.net/misc/050527-BlogHackersCon.pdf

発表資料補足(1)出力結果の見方:
- 「freq」: 一番左がこの二つの商品を同時に買った人の数。
  真ん中が上の商品を買った人の数。右が下の商品を買った人の数。
  例えば、「freq: 2 4 3」だと、上の商品を買った4人のうち2人が
  下の商品も同時に買った。 下の商品を買った3人のうち2人が
  上の商品も同時に買った。となる。
- 「mi」:相互情報量。大きければ大きいほど、
  二つの商品の関連性が高い!

発表資料補足(2): amazon アソシレポートから相互情報量を計算する
プログラム mi.pl のソースです。バグあったら教えてくださいな。
(「無償・無保証・著作権放棄」<http://lifehacks.ta2o.net/byebye-copyright.html>)
#!/usr/bin/perl
use strict;
use Encode;

### read amazon report (CSV)
my %shopping_cart;
my %info;
my $N;
while (<>) {
    my @item = split(/\t/, $_);
    my ($title, $asin, $date) = @item[1, 2, 3];
    next if (length($asin) != 10 or length($date) == 0);
    $shopping_cart{$date}{$asin}++;
    $info{$asin}{title} = $title;
    $info{$asin}{count}++;
    $N++;
}

### count pair
my %freq_pair;
foreach my $i (values %shopping_cart) {
    my @asin_list = keys %$i;
    next if (@asin_list < 2);
    for (my $i = 0; $i < @asin_list; $i++) {
	for (my $j = $i + 1; $j < @asin_list; $j++) {
	    my @tmp = sort ($asin_list[$i], $asin_list[$j]);
	    $freq_pair{$tmp[0]."\t".$tmp[1]}++;
	}
    }
}

### calculate mutual information
my %mi;
foreach (sort {$freq_pair{$b} <=> $freq_pair{$a}} keys %freq_pair) {
    my ($w1, $w2) = split(/\t/, $_);
    my $f12 = $freq_pair{$_};
    my $f1  = $info{$w1}{count};
    my $f2  = $info{$w2}{count};
    $mi{$_} = (log(($N * $f12)/($f1 * $f2)))/log(2);
}

### output
foreach (sort {$mi{$b} <=> $mi{$a}} keys %mi) {
    next if ($freq_pair{$_} < 2);
    my ($w1, $w2) = split(/\t/, $_);
    my $f12 = $freq_pair{$_};
    my $f1  = $info{$w1}{count};
    my $f2  = $info{$w2}{count};
    my $mi = $mi{$_};
    my $ostr = << "FMT"
----------
mi: $mi
freq: $f12 $f1 $f2
$w1 $info{$w1}{title}
$w2 $info{$w2}{title}
FMT
    ;
    print encode('euc-jp', decode('utf8', $ostr));
}

今回の発表用にデータを提供して頂いた聖幸さんに感謝です。ツイてる!

■関連リンク集: 不完全だけど。随時追加します。

【Blog Hackers Conference 2005】Six Apart宮川氏やはてな伊藤氏が語
るブログの未来と課題
<http://bb.watch.impress.co.jp/cda/event/9748.html>

前回: Blog Hackers Conference 2004[2004-09-15-2]

【送料無料商品】Blog Hacks

たつをの ChangeLog
Powered by chalow