08
Jun

“补充材料”实验总结

这个总结是针对我发起的这个实验。结果不出我所料,我的那篇日志成功地逃出了“补充材料”。如下图:

我没有在文章中增加任何内容,但是我做了如下处理:

1、添加了Trackback。
2、增加了相关文章。

这两个操作使网页“有效内容”增多,使之逃出了“补充材料”。

本来本文应该言尽于此,但是我觉得应该讲一点搜索引擎“噪音”的知识。

何谓搜索引擎的“噪音”?是指网页里面的导航条、广告、版权等公共的信息在每张网页上都有,如本博客的header、footer、siderbar部分,就是被搜索引擎称之为“噪音”。而相关文章、留言部分则不是,它们和文章部分一起,是网页的主要内容结构。搜索引擎在分析网页本身因素如:关键字加粗、关键字密度等因素的时候是以网页的“主要内容”为标的进行分析的,而不是整张网页。

需要说明一点的是,这些“噪音”可以把文章主体内容分隔,搜索引擎也能判断出来,如我在文章和相关文章、留言之间添加了一个版权,它也能认出这是“噪音”,所以“噪音”是不连续的,而文章主体内容也可以是不连续的。了解这个可以让你更好的控制关键字密度和排名。

一篇文章刚被“解禁”,另一篇文章却被列入“补充材料”,这一篇文章以前并未列入“补充材料”,那么为何被列入“补充材料”了呢?第一,这个文章没有复制互联网上别的文章,也没有在本站内形成复制网页;第二,链接结构保证它没有可能因为链接的缺少而被放入“补充材料”。因此我判断补充材料关于文章主体内容的字数可能跟主体内容和“噪音”的比例有关,因为我在最新文章显示可以最多有80篇文章,随着文章的增多,这个“最新文章显示”的“噪音”内容也越来越多,同时我增加了一个每篇文章后的“版权申明”,这些“噪音”内容稀释了主体文章内容,因此形成“补充材料”,这个跟“个人介绍”这个页面原理是一样的。我现在写了这个文章,文中留了该文的连接,自然会Trackback过去,也就说是,可以增加文章主体内容,看看是否能逃出补充材料,拭目以待吧!

2 Comments

Leave a comment

Name(required)
Mail (will not be published)(required)
Website

Fields in bold are required. Email addresses are never published or distributed.

Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>
URIs must be fully qualified (eg: http://www.dupola.com) and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.

    About

      这是sheawey的blog。原创内容谢绝所有商业媒体转摘。更多介绍请看这里

    Tag Cloud