最近几天,到处都在传播一个百度发布的“权威”blog数据,但是唯独在百度自己的 网站上找不到新闻通稿,很是奇怪。 再来看看这个数据,根据百度公布的统计报告显示,到目前为止,中国大陆Blog服务 商已达到658家,注册用户超过千人的服务商达到了330家,其中,中国名列前矛的 Blog服务商排名分别为:MSN Spaces、博客网、天涯博客、中国博客网、中华部落 阁、BlogBus、歪酷博客、博客园、网易博客、CSDN Blog、和讯博客、Donews Blog。 粗看到这个消息,还是蛮高兴的,因为百度并没有自己的blog服务,又有强大的搜索 引擎技术,作为第三方来提供这样一个数据和分析应该是相对客观的。但是看到了这 个分析结果后,我只能说百度这次的统计方法一定有很大的偏差,要不就是没有认真 做这个事情,或者有另外的一些因素在里面,因为这个数据实在是没有任何的参考价 值。

先说说都使用.text开源程序做的几个blog网站:中华部落阁、博客园、CSDN和 donews,其中中华部落阁、博客园、CSDN都公布了自己的用户数据,如下: 中华部落格的用户数52472,文章数280971 Csdn Blog用户数101663,文章数248190 博客园的用户数12303,文章数79717 我们很容易看到事实上用户数量Csdn> 中华部落格> 博客园,文章数中华部落格 > Csdn> 博客园,无论怎样分析也不会出现百度的统计中的中华部落格> 博客园> Csdn 的情况。

详细的关于.text开源blog程序网站的数据分析见: http://blog.donews.com/tinyfool/archive/2005/12/21/665436.aspx 就像tinyfool所说的,“我不知道百度是怎么做这个统计的,但是不管怎么做结果怎 么会有这么大的问题呢??百度号称10亿的网页数据库里面包含多少百分比的Blog数据 ,这些数据占实际存在的Blog页面的多少?百度怎么区分在Bsp域名下的普通页面和 Blog页面?百度怎么区分多个不同域名实际是一个页面的问题(中华部落格的页面就有 多重地址,用户的三级域名的,目录形式的,不同目录的)?这些问题在百度公开统计方 法之前我们很难猜到,但是我们可以看到结果是什么样的.我只能说这样一个完全不准 确的统计报告,没有任何的参考价值.” 我也深有同感,同时作为一个完全不懂技术的人,我用最简单的方法去Google搜索了 一下“百度发布中国Blog服务商TOP10”,

搜索结果数如下: 约有14,500,000项符合中国博客网的查询结果 约有5,610,000项符合和讯博客的查询结果 约有3,970,000项符合网易部落的查询结果 约有3,840,000项符合MSN Spaces的查询结果 约有2,730,000项符合博客网的查询结果 约有1,270,000项符合中华部落阁的查询结果 约有1,170,000项符合天涯博客的查询结果 约有945,000项符合donews的查询结果 约有607,000项符合博客园的查询结果 约有551,000项符合CSDN Blog的查询结果 约有508,000项符合BlogBus的查询结果 约有421,000项符合歪酷博客的查询结果 如果据此重排一下,依次是:blogcn、和讯博客、网易部落、MSN、博客网、天涯、 (中华部落阁?)、donews、(博客园?)、CSDN、BlogBus、歪酷博客,其中除 了中华部落阁和博客园应该是做了seo优化、被百度收录得比较多外,其它排名我觉 得大体差不多。 之所以说中华部落阁和博客园很可能做了seo优化,是因为他们的百度排名和alexa排 名差距太大。其中中华部落阁的alexa排名在8000左右,而博客园的排名在2400左右 。另外歪酷博客的排名也在2400左右,跟仅差一位的blogbus(alexa排名1300)差 距也太大。 唉,随便说说罢,数据这个东西说它客观也客观,说它主观也主观,关键是统计的方 法。上次搜狐艾瑞的那个调查,不管咋说人家好歹公布了统计方法,而百度这个完全 则是暗箱操作,在它没有公布自己的调查方法之前,只能说这个东西很无聊,和我的 这个帖子一样无聊。