Twitterの声優クラスタ調査

先日、有志によるオタク達の河口湖合宿にて、ネット上の声優ファンコミュニティの勢い調査のプレゼンをしました。

その中から、Twitterの声優クラスタ調査結果の詳細を紹介します。

Twitterには、mixiのようにわかりやすいコミュニティが存在しません。
そこで今回は、リスト機能を利用して形成されているクラスタを調べました。
調査方法は下記の通りです。

こうして得られたクラスタ人数のランキングは下記の通りです。*2
リンク先は各クラスタのユーザリストです(スクリーンネーム,所属リスト数)。

  1. 水樹奈々 2166人 (80 lists) ユーザリスト
  2. 田村ゆかり 1621人 (81 lists) ユーザリスト
  3. スフィア 1566人 (105 lists) ユーザリスト
  4. 茅原実里 1102人 (90 lists) ユーザリスト
  5. 坂本真綾 775人 (40 lists) ユーザリスト
  6. 堀江由衣 456人 (21 lists) ユーザリスト
  7. 神谷浩史 437人 (7 lists) ユーザリスト
  8. 平野綾 298人 (4 lists) ユーザリスト
  9. 釘宮理恵 96人 (6 lists) ユーザリスト

この中には、複数の声優クラスタに所属しているユーザもいます。そこで、下記の通りユーザの重複度合いを調べてみました。

まずは重複人数。

続いて重複率。重複率は A/(A+B-A∩B)A∩B/(A+B-A∩B) な感じで求めました。

クラスタ人数と重複率を考慮してクラスタを配置してみるとこんな感じ。

純粋に適当なデータ処理だけで出た結果ですが、割と体感通りなんじゃないでしょうか?


追記:

重複率はA∩B/Aの方が体感に合うんじゃね?的な意見があり、確かにと思ったので調べてみました。

新しく求めた重複率=浮気率を使ってクラスタ配置してみるとこんな感じになりました。

こっちの方が体感通りのような…?

*1:@hrdakinori さんの「ついったー リスト検索」 http://723.to/tw/listsearch.php を利用しました。Thanks!!

*2:これ以外には林原めぐみ中原麻衣クラスタを調べましたが、リストが見つかりませんでした。