网站地图的讲解

    网站无论大小,单独的网站地图页面部是必需的。通过网站地图,不仅用户可以对网站的所有内容一目了然,搜索引擎也可以跟踪链接爬行到网站所有主要部分。

 1、 HTML网站地图

    网站地图有两种形式。第一种称为HTML版本的网站地图,英文是sitemap,s需小写,特指HTML版网站地图。HTML版本网站地图就是用户可以在网站上看到的、列出网站
上所有主要页面链接的页面。
    对一些主导航必须使用JS脚本或Flash的网站(虽然我想不到什么原因必须要这么做),网站地凰是搜索引擎找到网站所有页面的重要补充途径。
    对小网站来说,网站地图页面甚至可以列出整个网站的所有页面。
    但对稍具规模的网站来说,一个网站地图页面不可能罗列所有页面链接,可以采取两种办法。一种方法是网站地图只列出网站最主要部分链接,如一级分类、二级分类。另一种方
法是将网站地图分成多个文件,主网站地图列出通往次级网站地图的链接,次级网站地图再列出一部分页面链接。多个网站地图页面加在一起,可以列出所有或绝大部分重要页面。
    实际上一个具有良好导航系统和链接结构的网站,并不一定需要完整的、列出所有页面的网站地图,因为网站地图与分类结构经常是大同小异的。

2、XML冈站地图

    网站地图的第二种形式是XML版本的网站地图。英文Sitemap中的S大写时通常特指XML版本的网站地图。
    XML网站地图由Google于2005年首先提出,2006年微软、雅虎都宣布支持n 2007年各主要搜索引擎都开始支持robots文件指定网站地图位置。百度现在也支持XML版本网站地图。
    XML版本网站地图由XML标签组成,文件本身必须是utf8编码。网站地图文件实际上就是列出网站需要被收录的页面URL。最简单的网站地图可以是一个纯文本文件,文件只要列出页面URL,一行列一个URL,搜索引擎就能抓取并理解文件内容。
    标准版本的XML网站地图文件如下列代码所示:
    <?xml  version="l.0’’encoding=¨UT F-8’‘?>
    <urlset   xmlns=" http: //www. sitemaps. org/schemas /sitemap/0.9’’>
    <url>
    <loc>ht tp:  //www. example, com/< /loc>
    <lastmod>20/O-OI-Ol(/lastmod>
    <changefreq>monthly(/changef req>
    <priority>0.日</pr』ort亡j,)
    </url>
    </urlset>
    其中urlset标签是必需的,声明文件所使用的Sitemap协议版本。
    url标签也是必需的,是它下面所有网址的母标签。
    loc标签也是必需的,这一行列出的就是页面完整URL。
    lastmod是可选标签,表示页面最后一次更新时间。
    changefreg是可选标签,代表文件更新频率。标签值包括:
    ·always,一直变动,指的是每次访问页面内容都不同。
    ·hourly,每小时。
    ·daily,每天。
    ·weekly,每星期。
    ·monthly,每月。
    .yearly,每年。
    .never,从不改变。
    网站地图中声明的更新频率对搜索引擎来说只是一个提示,供搜索引擎蜘蛛参考,但搜索引擎不一定真的认为页面更新频率就是站长自己声明的那样。
    priority是可选标签,表示URL的相对重要程度。可选0.0到1,0之间的数值,1,0为最重要,0.0力最不重要。默认重要程度值为0.5。站长可以使用priority标签告诉搜索引擎这个URL的优先级,比如通常首页肯定是1.0,分类页面可能是0.8,其他更深层页面重要性依次下降。这里所标志的重要程度只是相对于这个网站内部的URL所说的,与其他网站的URL重要性无关。所以把页面重要性标为1.0,并不能让搜索引擎认为这个页面比其他网站的页面更重要,只是告诉搜索引擎这个页面在本网站内是最重要的。
    XML网站地图文件最多可以列出5万个URL,文件不能超过10MB。如果网站需要收录的URL超过5万个,可以使用网站地图索引文件,也就是分成多个网站地图文件。一个网站最多可以有1000个XML网站地图文件,也就是可以列出5000万个网址。
    制作好网站地图文件后,可以有两种方式通知搜索引擎网站地图的位置,一是在站长工具后台提交网站地图文件。目前Google、雅虎、必应都已经开通站长工具,所有站长都可以注册。2010年4月份,百度也推出站长工具,正在内测中,还未对所有站长开放。百度站长工具的主要功能之一也是提交网站地图。
    另外一种方式是在robots.txt文件中通知搜索引擎网站地图文件位置,代码如下所示:
    l Sitemap: http://www.example.com/sitemap.xml
    胼有主流搜索引擎,包括百度、Google、雅虎、必应,都支持robots文件指定网站地图文件位置。
    通过XML网站地图通知搜索引擎要收录的页面,只能让搜索引擎知道这些页面的存一在,并不能保证一定被收录,搜索引擎还要看这些页面的权重是否达到收录的最低标准。一所以XML网站地图只是辅助方法,不能代替良好的网站结构。
    大中型网站提交网站地图通常有比较好的效果,能使收录增长不少。但也有的网站,尤其是小型网站,提交网站地图没有什么效果,有的站长甚至认为有反效果。
请尊重我们的辛苦付出,未经允许,请不要转载SEO自学网的文章!
上一篇:Hilltop算法
下一篇:花了500元买的SEO课程教程笔记公布