从“黑色梦中的SEO博客”(bloghuman.com)中了解到,他的首页被Google删除了,而其他页面却完好无缺,因为这个月初John Chow博客的首页也有被Google删除了,最后大家发现原来是John Chow为了消灭补充材料而写错robots文件的恶果。所以这一次“黑色梦中”的首页被Google删除,因此我首先怀疑是不是robots文件写错了。下面是他的robots文件:
User-agent: *
Disallow: /admin/
Disallow: /bak/
Disallow: /data/
Disallow: /editor/
Disallow: /inc/
Disallow: /install/
Disallow: /temp/
Disallow: /plugin/
这个没有任何问题,所以我们排除了robots文件的问题。从“黑色梦中”的描述中,他说他的首页进入补充材料,然后就不见了,有人说这是首页的关键字密度问题,我看这个根本不存在问题,他的好多文章置顶也不是问题的关键,不更新也不是问题(关于更新与首页是否会被列入“补充材料”的关系我下次撰文写一下,只有在某种情况下才触发,这个博客的url链接结构不存在这个触发的可能性),feed与首页同时存在也不是删除的原因,很多博客就是这么干的,就没看到哪个博客被这样搞过。
肯定是被搜索引擎惩罚了,就首页本身而言,没有作弊的行为,形成这种问题很多是因为“复制网页”。想到“复制网页”我们都会看链接的网页之间是否存在“复制网页”,既然首页被惩罚了,那么一般的想法就是比较与首页类似的页面,如tag、分类、日期等归档页面,老实说,这些归档页面只要你不是故意为之,很难与首页之间形成“复制网页”的,那么问题出在哪里呢?
我们用site:www.bloghuman.com搜索一下这个博客:

可以看到在文章tag页面、分类页面、日归档页面、月归档页面等,在google里面是静态地址,往后翻会看到完全相同的大量动态地址页面,而主页上的链接确全是动态地址。从搜索引擎收录来看,以前是静态地址,后来改成动态地址的。也就是说,这些页面除了文章页,首页外,任何一个页面都存在复制网页,而从静态地址到动态地址又没有做好301转向,这么大量的“复制网页”,不被搜索引擎惩罚才怪了。
原因已经说明了,解决方法就是两个,在google管理员中心删除这些页面或者做301转向,当然,后一种方法为好。
Leave a comment
Fields in bold are required. Email addresses are never published or distributed.
Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>URIs must be fully qualified (eg: http://www.dupola.com) and all tags must be properly closed.
Line breaks and paragraphs are automatically converted.
Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.