たつをの ChangeLog : 2006-10-18

Baiduよけ

2006-10-18-1 [WebTool][Tips]
中国の検索エンジン「百度」(Baidu)のクローラは元気が良すぎて困る。
今のところ利点はないのでクロールを拒否しておくことに。

そりゃまあ、百度から日本語での検索もできないことはないですけど、
そもそも日本語向けじゃないから精度は問題外。
- だめな例:パンク(ンはストップワードか?)
- 少しは見れる例:東京タワー

アクセスログに残っていたURL「网頁搜索幇助-禁止搜索引??収録的方法」
(http://www.baidu.com/search/robots.html) を見てみると、普通の
robots.txt の書き方が書いてあった。で、下記を robots.txt に追加。
User-agent: baiduspider
Disallow:

しかし、この Baiduspider、なかなか robots.txt を読みに来ない。
で、他のページはクロールしまくり。大丈夫か?

追記: 結局、アクセス禁止にしました。robots.txt も読まないわ、
CGIへのアクセスが1秒間に4回もあるわで、こりゃ共存は無理。
.htaccess に以下の記述を足しました。
order allow,deny
allow from all
deny from 60.28.17

追記061020: ヘルプ(网頁搜索幇助)の和訳がありました!
- SPHERICALMUSIC BLOG::baiduspiderのヘルプを訳してみた
  http://www.makou.com/index.php?e=840

追記061122: こんな記事があったんだった。

- グーグル覇権に挑む(4)中国のグーグル「百度(バイドゥ)」の実力
  【寄稿・前編】インターネット-グーグル覇権に挑む:IT-PLUS
  http://it.nikkei.co.jp/internet/special/search.aspx?n=MMIT05000008062006

追記:
404 Blog Not Found:クローラにしかとシカトしてもらう50の方法
http://blog.livedoor.jp/dankogai/archives/50672113.html
# mod_setenvif
BrowserMatchNoCase "baiduspider" evilua
# mod_access
Order allow,deny
Allow from all
Deny from env=evilua

今日のランチはみらのさんと「とんとことん」でブタでした。

ぶた入口

豚肉料理専門店 とんとことん 西麻布店
http://www.tontokoton.jp/omise_01.html
場所:東京都港区西麻布1-2-3 アクティブ六本木B1F

店内は意外とひろびろ。おしゃれ系です(たぶん)。
店内店内

ランチメニュー:
画像

「ミックスグリル」(900円) を食べました。お昼に焼肉です。
なんか嬉しい!お肉もけっこう良いっす。豚好きな私としては大満足。
画像焼く

こちらは「やわらかロースとんかつ」(1000円)。これもなかなかgood。
画像

他のランチメニュー(角煮カレーやフィレステーキ)も気になるです。


追記091026:
久しぶりにランチに行って豚肉を焼いてきました。
メニューもだいぶかわっていますね。
肉を焼くランチ1200円 豚肉を焼く ランチメニュー

SICP読書会に行きました。前回は[2006-10-11-3]
今日の会場は前回に引き続き三田某所です。会場ありがとうございます。

三田の壁会場

SICP Reading's Wiki
- http://www.csus4.net/hiki/SICPReading/
この記事に言及しているこのブログ内の記事

東京IT新聞より。
ドロップシッピングというのが注目されつつあります。
ドロップシッピングとは、
「商品の供給者が販売者に代わって商品を消費者に直送する仕組み」
ですが、
この販売者の呼称として「ドロップシッパー」が提唱されているとの記事。

これって、ドロップ失敗、みたいに聞こえて、
なんかさいさき悪そうな気がするのだが、いかがなものか。

     ∩
( ゜∀゜)彡 シッパイ!シッパイ!
 ⊂彡


Net::Amazon(v0.35)[2006-10-17-2]で locale を jp にして
blended で search すると警告が出まくる。
$ua->search(blended => "Perl");
↓
Use of uninitialized value in numeric comparison (<=>) at ...

ということで、Net/Amazon/Response/Blended.pm の該当箇所(下記)を
コメントアウトするとOK。
@lines = sort { $a->{RelevanceRank} <=> $b->{RelevanceRank} } @lines;

どうやら Net::Amazon が見る locale=jp でのデータには RelevanceRank
が存在しないようだ。上記の行の直下に以下を書いて、jpのときと指定な
しのときとで確認した。
print join("\n", map {join(", ", keys %$_)} @lines), "\n";

RelevanceRank がなくても、最初からソートされているみたいなので、
sortの行を消しても問題なさそう。とはいえ確信なし。
まあしばらく使っていればおかしいところに気づくかな、と。

たつをの ChangeLog
Powered by chalow