2006年 7月 29日


Filed under: ウェブログ — shiro @ 23:35



だいぶ前になるが、David Sifry[Technorati の創設者]のブログに、「ブログ界の現状」という興味深い連載記事が載った。


Sifry’s Alerts:”State of the Blogosphere, April 2006 Part 2: On Language and Tagging” by David Sifry:5月1日

      *      *      *


Technorati がフォローしている投稿の数でいうと、日本語、中国語、英語、スペイン語、イタリア語、ロシア語、フランス語、ポルトガル語、オランダ語、ドイツ語の順で多い。

Japanese, Chinese, English, Spanish, Italian, Russian, French, Portuguese, Dutch, and German are the languages with the greatest number of posts tracked by Technorati.






• The blogosphere is multilingual, and deeply international.

• English, while being the language of the majority of early bloggers, has fallen to less than a third of all blog posts in April 2006.

• Japanese and Chinese language blogging has grown significantly.

      *      *      *



ブログの世界では英語が最大の言語ではないということはいささか驚き(少なくとも英語世界にとっては)かもしれない。実のところ、Technorati が追跡している投稿全体の三分の一については英語は第一言語ですらない。

Something that may come as a surprise (at least to the English-speaking world) is that English isn’t the biggest language of the blogosphere. In fact, English isn’t even the primary language of one third of all posts that Technorati tracks anymore.



Last, Japanese bloggers appear to write shorter posts more often. This could be a result of blogging from mobile phones, and may be skewing the results, given that we are tracking the total number of posts in this analysis.


もうひとつの興味深い点は、中国のブログ界は2004年と2005年に急激な伸び(MSN Spaces の中国語版開始したことで はピーク時には中国語全体の25%を占めた)を見せたが、今年はいささかスローダウンしている。

Another interesting finding is that the Chinese blogosphere, which grew significantly in 2004 and 2005 (launches of MSN Spaces in Chinese, saw a peak of 25% of all posts in Chinese in November 2005) seems to be slowing down somewhat this year.


韓国語のブログについては実際よりだいぶ少なめだ。これは韓国最大のブログである Cyworld や Planet Weblog が、現時点ではまだ Technorati のインデックスの対象になっていないためだ。

Second, we believe that we are grossly undercounting the Korean blogosphere, mostly due to the fact that the largest Korean blog and hompy services (like Cyworld or Planet Weblog) are not being indexed by Technorati at this time.


フランス語についても、我々の skyblog によるインデックスが十分でないためやや少なめだ。この事態を是正したいと思っているので、関心のあるブログサービスは一報願いたい。

In addition, we believe that we’re somewhat undercounting the French blogosphere, in particular because our indexing of skyblog is poor. We’d love to rectify this – if anyone at these (or other) blogging services is interested in being indexed, please drop me a line.

      *      *      *


Technorati は2005年4月に、フォローしているブログの主言語(primary language)の自動追跡をはじめた。その目的は、ユーザーが母国語以外の投稿をフィルターできるようにするためだった。このフィルターは検索結果表示ページのプルダウンメニューで利用できる。世界的にブログが伸びているのはどこか、それにはなんらかの傾向があるか、そういったことも我々は知りたかったからだ。

Back in April 2005, Technorati started automatically tracking the primary language of each blog that we tracked. We did this so that we could easily allow people to filter out posts in languages other than their native language. This is available in a pull-down menu on every search results page. We also wanted to get some idea of where the worldwide growth of blogging was taking place, and what trends we could glean from the data.

      *      *      *


データについては、以下に説明する重要なポイントがある。まず第一は、自動言語解析ソフト(languid)には、バグがあるかもしれないということだ。ある言語グループを数え過ぎたり、数え足りなかったりするのだ。我々としてはソフトの能力を常に改良しており、Technorati がフォローしている膨大なデータ量(ブログ数 3500 万、一日の投稿数 120 万)の解析の信憑性には自信を持っている。

There are three very important caveats in the data sets that I’m going to describe below. The first is that we are using automated language analysis software (based on languid), and it may have bugs, thus over or undercounting a particular language or group of languages. We’re going to be continually improving the capabilities of this software, but we are pretty confident in its ability to work reliably, especially over the large data sets that Technorati tracks (over 35 million blogs at this time, and over 1.2 million posts each day).

      *      *      *



Another key point to remember is that language breakdown does not necessarily imply a particular country or regional breakdown. For example, Spanish and English are spoken in a large number of countries around the globe – and this analysis doesn’t attempt to determine from which country a blogger is writing from – only the primary language of her post.

      *      *      *







Technorati Tags: ,


3件のコメント »

  1. 1日70回更新のヒトもいるらしいですからね…

    コメント by satomi — 2006年 8月 6日 @ 04:24

  2. > satomi さん
    同じ数量が表しているものが 言語によって その内容が異なるというのは たいへんおもしろいと思いました
    どれが正しくて どれが間違っているという問題ではありませんが もっと中味の分析が欲しいですね

    コメント by shiro — 2006年 8月 6日 @ 11:38

  3. Bloggerのリニューアル


    コメント by マルコ式ネット白書 — 2006年 8月 17日 @ 13:39

RSS feed for comments on this post. TrackBack URI


以下に詳細を記入するか、アイコンをクリックしてログインしてください。 ロゴ アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )


%s と連携中