TAK

日本語splogサンプリング調査

統計 http://updatenews.ddo.jp/d/
splog filter http://updatenews.ddo.jp/b/



サンプリング率は0.001です
日本語splogは予想よりは少ないです。

2007年11月25日 03:00 〜 28日 03:00 の 72時間 から 1519件をサンプリングしました。
splogは90%はあるんじゃないかと予想していましたが、30%ぐらいです。


わたくしの分類は、UMBC eBiquity Research Groupとは違い、定義づけするとすれば....

  • blogとして編集可能なコンテンツの100%が何らかの情報源からのコピーである。

(この場合の情報源とは、オフライン、オンラインには限らず、またはテンプレートとして(非公開で)用意されている文字列なども含める)

  • 人間が投稿しているわけではない、明らかにツールによって自動的に生成されたコンテンツである。(と推測できる)

以上の条件を満たすものです。


人間が投稿したコンテンツであり、情報量が十分に大きいblogであれば、それはsplogとはしませんでした。
つまり、オリジナルのコンテンツであるということ、他のコピーや、他に類似しすぎたコンテンツが存在しなければいいということです。


写真だけで文はなしとか、
写真もなしで 100文字以下の本当につぶやき程度のコンテンツでも、splog扱いはしませんでした。



さて、各CSPごとのsplogの割合です。
割合 % で見せるとあまりその量がわからないので、積み上げグラフにしました。


特にSeesaa がひどいです。その90%以上がsplogです。
Seesaaだけで日本語splogの3分の1を占めています。

そしてこれは、世界的には
全世界のブログのうちの 4% がSeesaa splogであるという驚異的な結果?ですよ。