标题:谈谈个人对GOOGLE补充材料的看法

-------------------------------------------------------------------------------------------------------------------------------

时间:2007/7/26 16:51:55

-------------------------------------------------------------------------------------------------------------------------------

内容:

经常游离于chinaz,admin5,im286,一直没说话,看到那么多站长都把自己的经历写出来,我也忍不住想说说我的感受.

    我做网站也有几年的历史了,大三的时候,因为时间比较多,做过一个游戏网站,也赚过几百块钱,后来大四因为忙了一些,所以网站荒废了,今年工作之后,玩游戏玩的没意思了,就卖掉帐号,买了空间域名重新开始做网站.在这里先提下我的网站http://www.52vst.com.网站才开张10几天,做的比较差,希望大家别见笑.

   好了,现在谈正题了.今天早上象往常一样打开GOOGLE,查询自己网站的收录情况,发现GOOGLE收录了200多页,昨天才100页不到.心里比较高兴,便仔细看了看网站的收录结果.发现其中不少是补充材料.很是奇怪,就逐个去研究起来.

 

 

结果分析:GOOGLE的补充材料分为几类:

 

 

   第一类是自己网站内部的重复材料,比如你网站更新,改了版本,或者存在两个极其相似的页面,一般GOOGLE会把时间早一点的页面标为补充材料.就象这个http://www.google.cn/search?complete=1&hl=zh-CN&newwindow=1&q=+site:www.52vst.com+%E4%B8%AD%E5%9B%BDVista%E8%81%94%E7%9B%9F-%E6%89%93%E9%80%A0%E5%9B%BD%E5%86%85%E6%9C%80%E4%B8%93%E4%B8%9A%E7%9A%84VISTA%E4%B8%BB%E9%A2%98%E7%BD%91%E7%AB%99%3E%3E+%E8%A7%86%E9%A2%91%E6%95%99%E7%A8%8B,同样是网站文章频道的分类,有些比较早的就被当作是补充材料,因为页面模式都比较相似.

 

   第二类是和外部网站对比的,这个就有点属于抄袭转载一类了.蜘蛛抓取页面的时候,经常会遇到不同网站的几个相似页面,假如相似程度很大,他会按照自己的规则把其中一个定为补充材料.当然,这个地方可能存在误操作,因为能够查到一些文章出处都被标为补充材料的,而这类被标为补充材料的网站很大程度上存在一个问题,比如我们搜索http://www.google.cn/search?q=Win+XP+SP2%E5%AE%89%E8%A3%85%E8%AE%BE%E7%BD%AE%E5%AE%9E%E7%94%A8%E6%89%8B%E5%86%8C&complete=1&hl=zh-CN&newwindow=1&start=0&sa=N 可以发现被标为补充材料的网站DE***ION都有点堆砌词语的感觉.

   因此,我觉得,避免出现补充材料的办法可以针对以上几点:1.网站更新或者改版的时候,尽量让老页面页存在于网站中,最好是能够适当提及,这样便于蜘蛛能够重新进去读取,从而撤销补充材料标记.2.去做好自己网站的每个页面,尽量让每个页面看起来不是太相似,首先标题必须不一致.3.转载其他网站内容的时候,最好让内容或者最起码标题不能一致,这样可以适当的减少补充材料的列入.4.写好Description,千万不要堆砌词语.

  

经常游离于chinaz,admin5,im286,一直没说话,看到那么多站长都把自己的经历写出来,我也忍不住想说说我的感受.

    我做网站也有几年的历史了,大三的时候,因为时间比较多,做过一个游戏网站,也赚过几百块钱,后来大四因为忙了一些,所以网站荒废了,今年工作之后,玩游戏玩的没意思了,就卖掉帐号,买了空间域名重新开始做网站.在这里先提下我的网站http://www.52vst.com.网站才开张10几天,做的比较差,希望大家别见笑.

   好了,现在谈正题了.今天早上象往常一样打开GOOGLE,查询自己网站的收录情况,发现GOOGLE收录了200多页,昨天才100页不到.心里比较高兴,便仔细看了看网站的收录结果.发现其中不少是补充材料.很是奇怪,就逐个去研究起来.

 

 

结果分析:GOOGLE的补充材料分为几类:

 

 

   第一类是自己网站内部的重复材料,比如你网站更新,改了版本,或者存在两个极其相似的页面,一般GOOGLE会把时间早一点的页面标为补充材料.就象这个http://www.google.cn/search?complete=1&hl=zh-CN&newwindow=1&q=+site:www.52vst.com+%E4%B8%AD%E5%9B%BDVista%E8%81%94%E7%9B%9F-%E6%89%93%E9%80%A0%E5%9B%BD%E5%86%85%E6%9C%80%E4%B8%93%E4%B8%9A%E7%9A%84VISTA%E4%B8%BB%E9%A2%98%E7%BD%91%E7%AB%99%3E%3E+%E8%A7%86%E9%A2%91%E6%95%99%E7%A8%8B,同样是网站文章频道的分类,有些比较早的就被当作是补充材料,因为页面模式都比较相似.

 

   第二类是和外部网站对比的,这个就有点属于抄袭转载一类了.蜘蛛抓取页面的时候,经常会遇到不同网站的几个相似页面,假如相似程度很大,他会按照自己的规则把其中一个定为补充材料.当然,这个地方可能存在误操作,因为能够查到一些文章出处都被标为补充材料的,而这类被标为补充材料的网站很大程度上存在一个问题,比如我们搜索http://www.google.cn/search?q=Win+XP+SP2%E5%AE%89%E8%A3%85%E8%AE%BE%E7%BD%AE%E5%AE%9E%E7%94%A8%E6%89%8B%E5%86%8C&complete=1&hl=zh-CN&newwindow=1&start=0&sa=N 可以发现被标为补充材料的网站DE***ION都有点堆砌词语的感觉.

   因此,我觉得,避免出现补充材料的办法可以针对以上几点:1.网站更新或者改版的时候,尽量让老页面页存在于网站中,最好是能够适当提及,这样便于蜘蛛能够重新进去读取,从而撤销补充材料标记.2.去做好自己网站的每个页面,尽量让每个页面看起来不是太相似,首先标题必须不一致.3.转载其他网站内容的时候,最好让内容或者最起码标题不能一致,这样可以适当的减少补充材料的列入.4.写好Description,千万不要堆砌词语.