お互いのブログにブックマークしあう集団「はてな互助会」のメンバーリスト
2016-07-05-1
[HatenaWork][Release]
「はてな互助会」のメンバーを自動判定して抽出しています。その一覧(序列順)を公開します。
リストは1時間ごとに自動更新されます。ランキング形式となっているので、該当ユーザは順位変動をお楽しみください。
「はてな互助会」とは何かについて説明します。諸説ありますが、今回のタスクにおける定義は下記の通り。
「はてブする」とは「はてなブックマーク」でブックマークを行うことを意味します。
4については、自動抽出の際に対象とするデータが多すぎると困るので導入した条件です。ホットエントリに登場しない限りは互助会に無関係な人にあまり影響を与えないので、合理的な条件かなあ、と。
はてな互助会は、実際にそういうグループが存在して活動しているという噂も聞きますが、ここでは単にはてな内部でお互いにハテブしている独立ユーザたちを仮想的なグループとみなして「互助会」と呼んでいます。
上記の処理に利用しているTSV的なデータを公開しています。「可視化」等にご自由にお使いください。ただし、利用時の直接アクセスはご遠慮ください(ダウンロードして使って!)。
先日から「ぬきのみホッテントリ」と題して、「はてな抜きのホッテントリ」などの「はてなブックマークのホットエントリにフィルタをかけたもの」を作成し公開しています。そして、そのフィルタの一つとしていわゆる新しく互助会ブログを加えようとしています。
互助会メンバーのブログはいわゆる内輪な話が多く、分かっている人は楽しめるのですが、そうでない人にとっては意味がないものです。そのため、読みたい人、読みたくない人それぞれにとって有益でハッピーになるようホットエントリを分離する予定です。乞うご期待。
互助会リスト自体はそれだけでも何かのお役に立ちそうなので先行して公開させていただきました。
どうぞご利用ください。
本記事では互助会の良し悪し(擁護や批判)についてはいっさい言及しておりません。ご承知おきください。念のため。
- 相互ブクマはてなブロガーリスト(旧名:はてな互助会メンバーリスト)
- 追記160706: 名称を変更しました。「互助会」という言葉が一人歩きしやすく、システムのための独自の定義をしても伝わりにくいため。長いのですが定義そのものを名称にしました。
リストは1時間ごとに自動更新されます。ランキング形式となっているので、該当ユーザは順位変動をお楽しみください。
はてな互助会とは?
「はてな互助会」とは何かについて説明します。諸説ありますが、今回のタスクにおける定義は下記の通り。
- (1) はてなブックマークのユーザである
- (2) はてなブログのユーザである(はてなブログでブログを運営している)
- (3) 他のはてなブログの記事をはてブしており、かつ、そのはてなブログのユーザが自分のはてなブログをはてブしている
- (4) 自分のはてなブログの記事がここ最近のホットエントリに登場したことがある
「はてブする」とは「はてなブックマーク」でブックマークを行うことを意味します。
4については、自動抽出の際に対象とするデータが多すぎると困るので導入した条件です。ホットエントリに登場しない限りは互助会に無関係な人にあまり影響を与えないので、合理的な条件かなあ、と。
はてな互助会は、実際にそういうグループが存在して活動しているという噂も聞きますが、ここでは単にはてな内部でお互いにハテブしている独立ユーザたちを仮想的なグループとみなして「互助会」と呼んでいます。
判定方法
- 事前の処理
- ホットエントリに登場した全てのページに対して
- はてなブログか否かを判定し、はてなユーザIDを収集
- ホスト名とはてなユーザIDの対応辞書(1)として保存
- ※はてな抜きホッテントリ用にすでに継続的に収集しているのでこれを用いる
- ホットエントリに登場した全てのページに対して
- はてブ行為リストの取得
- ホットエントリに登場した全てのはてなブログの記事に対して
- 辞書1を用いそのブログ記事のはてなユーザID(A)を取得
- 該当記事に付いたブックマーク一覧をRSSから取得
- RSS中の全ぶくまユーザIDに対して辞書1を用いはてなブログのユーザ(B)のみを保存する
- はてなユーザAに対して、はてブしたユーザB1,B2,B3,B4,...という被ブクマリスト(FROM)ができる
- ラベル:A, 要素:B1,B2,B3,...
- ホットエントリに登場した全てのはてなブログの記事に対して
- 互助会判定
- 被ブクマリスト(FROM)を転置して、各ユーザがぶくましたはてなブログのユーザのリストであるブクマ行為リスト(TO)を作成する
- ラベル:B1, 要素:A1,A2,A3,...
- 被ブクマリスト(FROM)の各ユーザIDに対して下記の処理を行う
- そのユーザの被ブクマリスト(FROM)の要素とブクマ行為リスト(TO)の要素から共通するユーザを取り出し共通リスト(COM)とする
- ユーザIDをCOMの要素数でソートし足切り
- 被ブクマリスト(FROM)を転置して、各ユーザがぶくましたはてなブログのユーザのリストであるブクマ行為リスト(TO)を作成する
上記の処理に利用しているTSV的なデータを公開しています。「可視化」等にご自由にお使いください。ただし、利用時の直接アクセスはご遠慮ください(ダウンロードして使って!)。
今回の作業の目的
先日から「ぬきのみホッテントリ」と題して、「はてな抜きのホッテントリ」などの「はてなブックマークのホットエントリにフィルタをかけたもの」を作成し公開しています。そして、そのフィルタの一つとしていわゆる新しく互助会ブログを加えようとしています。
- ぬきのみホッテントリ
- いろんな「抜き」や「のみ」のホッテントリのリストページ
- 例:はてな抜きのホッテントリ
互助会メンバーのブログはいわゆる内輪な話が多く、分かっている人は楽しめるのですが、そうでない人にとっては意味がないものです。そのため、読みたい人、読みたくない人それぞれにとって有益でハッピーになるようホットエントリを分離する予定です。乞うご期待。
互助会リスト自体はそれだけでも何かのお役に立ちそうなので先行して公開させていただきました。
どうぞご利用ください。
おわりに
本記事では互助会の良し悪し(擁護や批判)についてはいっさい言及しておりません。ご承知おきください。念のため。