如何清除网站内复制的内容?

    网址规范化问题造成的复制内容,前面已经讨论过。最好的解决办法是,确保一篇文章只对应一个URL,不要出现多个版本,网站所有内部链接统一连到这个URL。某些时候需要使用301转向。
    不是由于网址规范化造成的同站内复制内容,解决的最好方法是选取一个版本允许收录,其他版本禁止搜索引擎抓取或收录。既可以使用robots文件禁止抓取,也可以使用nomdex meta robots标签禁止索引。连向不希望收录的复制内容的链接使用NoFollow,JavaScript等阻止蜘蛛爬行。
    另一个解决复制内容的方法是使用canonical标签。canonical标签既可以应用在网址规范化引起的复制内容上,也可以用在其他情况下。比如网站上同一个款式的鞋子可能分为不同型号,型号之间唯一的区别只是颜色。这些型号生成多个网址,产品说明也几乎完全一样,只是说明颜色的地方不一样。这时就可以使用c anonical标签,用户不会被转向,还是看到不同页面,但搜索引擎会把权重集中到其中一个型号上,从而避免复制内容带有Session ID的页面也可以使用canonical标签,如页面http://www.example.com/page-a.html放上代码:
    I<link rel=¨canonical" href=”http://www. example. com/page-a. html"/>
    这样,后面无论生成什么Session ID:
    http: //www. example. com/page-a. html? ses sionid=123 456
    http: //www. example. com/page-a. ht ml? sesSionid=45 67 89
    上面的URL都会被搜索引擎把权重集中到http://www.example.com/page-a.html
    不同网站之间复制内容解决起来就比较麻烦,因为其他网站上的内容是无法控制的。能够做的只有两点。一是在页面中加入版权声明,要求转载的网站保留版权声明及指向原出处的链接。有些聚合网站会抓取feed自动生成内容,所以在feed中也要加入版权声明和链接。一般来说,原创版本的外部链接会比转载多一些,就算在中文互联网这个对版权极不重视的环境下,也还会有一些站长转载时保留原出处链接。对拽索引擎来说,指向原出处的链接是判断原创的最重要信号。
    另一点就是坚持原创,假以时日必定能够增加网站权重,使网站上内容被判断为原刨的机会增加。
    如果有其他网站大量抄袭,造成原创内容不能获得排名,也可以考虑联系对方,要求加上版权链接或删除抄袭内容,或者向对方主机、域名提供商投诉,向搜索引擎投诉等。
请尊重我们的辛苦付出,未经允许,请不要转载SEO自学网的文章!
上一篇:复制内容的害处
下一篇:绝对路径和相对路径