为什么要网址URL规范化

    网址规范化( URL canonicalization)指的是搜索引擎挑选最合适的URL作为真正(规范化的)网址的过程。

 1、为什么出现不规范网址

    举例来说,下面这几个URI一般指的是同一个文件:
    ·  http://www.domainname.com
    ●http://domainname.com
    ●  http://www. domainname,c om/inde x.html
    ●http:Udomainname.com/index.html
    但是从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把它们当做不同的网址。虽然在绝大部分情况下,这些网址所返回的是相同的文件,也就是网站首页,但是从技术上说,主机完全可以对这几个网址返回不同的内容。
    除了上面因为带与不带www造成的,以及结尾是否带index.html文件名造成的不规范网址,网址规范化问题还可能由于如下原因出现:
     CMS系统原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL访问。
    ·URL静态化设置错误,同一篇文章中有多个静态化URL。
    ·URI。静态化后,静态和动态URL共存,都有链接,也都可以访问。
    目录后带与不带斜杠。
    http://www.domainname.com
    和
    http://www.domaumame.com/是不同网址,但其实是一个页面。
    ·加密网址。
    http://www.domainname.com
    和
    https://www.domainname.com
    同时存在,都可以访问。
    ·URL中有端口号。
    http://www.domainname.com:80
    和
    http://www.domain_name.com
    ·跟踪代码。有的联署计划或广告服务在URI。后面加跟踪代码,如http://www.
    domainname.com/?affid=100
    ·显示的都是首页内容。

2、 网址规范化问题

    网站出觋多个不规范网址会给搜索引擎收录和排名带来很多麻烦。比如,网站首页应该是固定的,只有一个,但很多站长在链接回首页时所使用的URL并不是唯一的,一会儿连至Ij http://www.domainname.com,一会儿连到http://www. domainname,co m/index.html。
    虽然不会给用户造成什么麻烦,因为这些网址其实是同一个文件,但是给搜索引擎造成了困惑,哪一个网址是真正的首页呢?哪一个网址应该被当做首页返回昵?
    如果网站上不同版本的网址同时出现,那么两个或更多版本的URL都可能被搜索引擎收录,这就会造成复制内容。搜索引擎计算排名时必须找到所谓规范化的网址,也就是搜索引擎认为的最合适的URL版本。
    网址规范化造成几个问题:
    ·CMS系统在不同地方链接到不同的URL,分散了页面权重,不利于排名。
    ·外部链接也可能指向不同URL,分散权重。
    ·搜索引擎判断的规范化网址不是站长想要的那个网址。
    ·如果网址规范化问题太严重,也可能影响收录。一个权重不很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的。搜索引擎把资源花在收录不规范的网址上,留下给独特内容的资源就减少了。
.复制内容过多,搜索引擎可能认为有作弊嫌疑。
请尊重我们的辛苦付出,未经允许,请不要转载SEO自学网的文章!
上一篇:URL的设计
下一篇:怎么解决URL规范化的问题