たつをの ChangeLog : 2010-09-05

こんな本が出ていたのかあ。

蒲生睦男 / さすが!と言わせる Plagger徹底攻略術


そういうえば「それPla!」って最近めっきり聞かない。
死語っぽい。
Plagger が浸透してわざわざ言わなくなったのか、Plagger 自体が廃れたのか。
まったく追ってないので分かんないんだけど、前者なのかなあ。

ref.
- [を] Software Design 2006年10月号のPlagger特集のメモ[2006-09-24-1]

JANから楽天のレビューを取得したい。
調べてみると現在の楽天APIではできないと判明。

- 【楽天ウェブサービス】RAKUTEN WEBSERVICE
http://webservice.rakuten.co.jp/

じゃあ、楽天のユーザレビューページのリンクをスクレイピングなしで取得できないか。
つまり、JANからユーザレビューURLを取得する方法はあるか、ということ。

例えば、
(1) JANコード
「4547462065681」
(2) そのJANコードを持つ商品の一つのURL(楽天ブックス扱い)
http://item.rakuten.co.jp/book/6248233/
(3) それ対してのユーザレビュー(購入者のみ)一覧のURL
http://review.rakuten.co.jp/item/1/213310_13447464/1.1/
の場合に (1) から (3) を得たい。
API では (1) から (2) を得ることはできるが、(3) は得られない。
もちろん (2) をスクレイピングすれば (3) を得ることができるが、それはしたくない。

楽天商品検索APIでJANをキーに検索すると、扱ってるショップごとの商品URLとitemCodeを得ることができる。

JANが前述の
「4547462065681」
の場合、商品の一つ(楽天ブックス扱い)の商品URLは
http://item.rakuten.co.jp/book/6248233/
で、itemCodeは
「book:13447464」
である。

itemCodeの前半の「book」はショップが「楽天ブックス」であることを表している。
itemCodeの後半の「13447464」はショップ内でのユニークな商品識別コードを表していると思われる。

これだけの情報では、ユーザレビュー一覧のURL
http://review.rakuten.co.jp/item/1/213310_13447464/1.1/
を構築できない。
このURL中の「/213310_13447464/」の部分の前半「213310」がショップを表す数値コードと思われるが、全ショップについての対応表がない。

ここで手詰まり。
しかし、楽天ブックスの商品に限定すれば「JANからユーザレビューURLを取得する」ことができる。
つまり「book」(楽天ブックス)については数値コード「213310」決め打ちにしちゃえばOK。
もちろん他のショップに対しても同様に自分で対応表を作ればOKなのだが、かける手間と効果を考えると楽天ブックス以外は非現実的である。

以上。

関連記事

- 楽天ブックスに感動→ブログのリンクをamazonから楽天ブックスに切り替えます (勝間和代公式ブログ: 私的なことがらを記録しよう!!)
http://kazuyomugi.cocolog-nifty.com/private/2010/07/amazon-8c96.html
楽天ブックスのレビューは、楽天ブックスでその商品を買った人しか、書けず、さらに、十分な数が集まらないと、平均値がでないようになっていること。
ユーザーの集合知の問題点は、どうやって真摯なレビューと、特定の意図(それは偏った善意・悪意を含む)を持ったレビューを見分けるかです。
少なくとも購買したということは高い確率で読んで、かつ、デリバリーされる実在の住所の登録があるということですから、誰でも書けるものよりは、信頼性が高まる可能性があると思います。
- 勝間和代の楽天シフトから考えるamazonの難点 (試みの水平線)
http://blog.livedoor.jp/yoheitsunemi/archives/51124025.html
たしかにamazonって、1回でもamazonで買ったことのある人なら、その本を買っていなくても、読んでいなくてもレビューが書けるからね。だから、買っていない本に酷評コメントがついたりする。

たつをの ChangeLog
Powered by chalow