類似記事を表示してくれるブログパーツが公開されています。
- 【シムエントリ】記事同士でブログをむすぶブログパーツ
http://se.koemu.com/
- こえむの編集後記 > ブログを記事で結ぶブログパーツ『シムエントリ』をリリース
http://www.koemu.com/blog/2008/02/21/sim-entries/
ベクトル空間モデル (Vector Space Model) で、
類似文書を検索。単語の重み (term weight) は TF-IDF。
JSON API もあり。
登録したブログの RSS に含まれるエントリのみが表示対象だそうです。
まだサービス開始から間もないので、
しばらくは偏ったブログのエントリしか出てこないかな。
スタート段階は、ブログのホワイトリストを取ってきて
全 RSS を登録してしまってもよいかも。
たとえば smashmedia の河野さんらがやっている「ぽぷる」とか。
- ぽぷる
ttp://whitelist-blog.sakura.ne.jp/
http://pople.jp/
追記080226: ITmedia で取り上げられてますね。
- ブログを類似記事で結ぶパーツ「シムエントリ」 - ITmedia News
http://www.itmedia.co.jp/news/articles/0802/25/news104.html
あとは、じゃんじゃん登録してくるであろうスパムブログを
どうやってはじくか、ですね。
- 【シムエントリ】記事同士でブログをむすぶブログパーツ
http://se.koemu.com/
- こえむの編集後記 > ブログを記事で結ぶブログパーツ『シムエントリ』をリリース
http://www.koemu.com/blog/2008/02/21/sim-entries/
ベクトル空間モデル (Vector Space Model) で、
類似文書を検索。単語の重み (term weight) は TF-IDF。
JSON API もあり。
登録したブログの RSS に含まれるエントリのみが表示対象だそうです。
まだサービス開始から間もないので、
しばらくは偏ったブログのエントリしか出てこないかな。
スタート段階は、ブログのホワイトリストを取ってきて
全 RSS を登録してしまってもよいかも。
たとえば smashmedia の河野さんらがやっている「ぽぷる」とか。
- ぽぷる
http://pople.jp/
追記080226: ITmedia で取り上げられてますね。
- ブログを類似記事で結ぶパーツ「シムエントリ」 - ITmedia News
http://www.itmedia.co.jp/news/articles/0802/25/news104.html
あとは、じゃんじゃん登録してくるであろうスパムブログを
どうやってはじくか、ですね。
この記事に言及しているこのブログ内の記事