12
2010

乱弹国内搜索引擎对个人博客的收录



国内搜索引擎,知名度较大的有Baidu,Soso,Youdao.

我的博客网站建于2010年2月4日,starhai.tk域名启用较晚,网站与2月18日更改过静态链接方式。下文所说重复链接是指带WWW与不带WWW各被收录一次,1次重复链接=2个链接。

搜索内容 Baidu结果 Soso结果 Youdao结果
site:starhai.tk

博客中共29遍文章,期望能从搜索引擎得到博客网站的35个以上索引。

共5页内容,50条

最早一次收录2-4
最晚一次收录2-20

共7个其中仍有效链接为3个,其余链接都已失效的。

1次重复链接

共2页内容,11条

最早一次收录2-14
最晚一次收录3-8

所有链接均有效

 

无重复链接

共1页内容,1条
 
最晚一次收录3-3

只收录了主页

domain:starhai.tk 共3条

1次重复链接

共0条 共1条
link:starhai.tk 共1条 共0条 共0条

综上可见,baidu爬虫太懒了,都半个多月没有来了,其爬虫更新是没有删除无效链接,很适合浏览网站的历史版本,快照功能大大有用了。Soso还是比较勤奋的,收录虽然不多,但都是有效链接,2月18日改版后无链接被删除了。Youdao更简单,只是告送你我收录这个网站了,主页就是这样子。

我的博客网站在baidu中的权重不高,baidu爬虫很久才访问一次很正常,由此得出好多权重不高的网站被baidu索引内容是很滞后的,这些网站离baidu好似0.05光年似的(半个多月才能把更新传递到baidu)。

Baidu对于个人博客的索引不如Soso,youdao可说根本不收录。

再看看Google的收录

site:starhai.tk  收录189条,Google太勤奋了 除去 t.starhai.tk  www.starhai.tk m.starhai.tk wap.starhai.tk等带来的重复收录,实际收录约为37条,最后一次收录3-4日。

link:starhai.tk 收录0条。

这就是我搜索引擎为什么喜欢Google的理由了,收录够全,够快。





发表评论