怎么设计一个搜索引擎有好的网站

    如果我们从搜索引擎蜘蛛的角度去看待一个网站,在抓取、索引和排名时会遇到哪些问题呢?解决了这些问题的网站设计就是搜索引擎友好( search engine friendly)的。
    1.搜索引擎蜘蛛能不能找到网页
    要让搜索引擎发现网站首页,就必须要有外部链接连到首页,找到首页后,蜘蛛沿着内部链接找到更深的内容页,所以要求网站要有赵好的结构,符合逻辑,并且所有页面可
以通过可爬行的普通HTML链接达到。JavaScript链接、Flash中的链接等搜索引擎蜘蛛一般不能跟踪爬行,就会造成收录问题。
    网站所有页面离首页点击距离不能太远,最好在四五次点击之内。要被搜索引擎收录,页面需要有最基本的权重,良好的网站链接结构可以适当传递权重,使尽量多的页面达到收录门槛。
    2.找到网页后能不能抓取页面内容
    被发现的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、Session ID、整个页面是Flash、框架结构(frame)、可疑的转向、大量复制内容等都可能使搜索引
擎敬而远之。
    某些文件站长可能不希望被收录,除了不链接到这些文件,更保险的方法是使用robots文件或meta robots标签禁止收录。
    3.抓取页面后怎样提炼有用信息
    关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可以帮助搜索引擎理解页面内容,提取有用信息。这部分在第5章“页面优化”部分再深入讨论。
    只有搜索引擎能顺利找到所有页面,抓取这些页面并提取出其中真正有相关性的内容,网站才可以被视为是搜索引擎友好的。
    网上搜索引擎不友好的网站比比皆是,尤其是一些中小企业网站。不过这样的网站不太好举例,没得到网站主人的许可就当做负面案例讨论非常不恰当。在写本节时刚好在zaccode.com网站看到一个会员询问搜索引擎不收录他们的内页是怎么回事。笔者点击过去看了一下,不由得惊呼,这个网站简直是集搜索引擎不友好之大成,是个相当不错的反面教材。在得到网站所有人正式许可后,在这里作为例子简单介绍。
    网站域名是llyez.com,南昌良良母婴用品有限公司,一个母婴保健及家居用品企业网站。应该说网站视觉设计还是不错的,然而从SEO角度看,简直就是个“杯具”。
面教材。在得到网站所有人正式许可后,在这里作为例子简单介绍。
    除了页脚的联系地址、版权声明两行字外,页面其他部分就是一个大的Flash,源代
码如下:

    <! DOCTYPE  html  PUBLICtI-//W3C//DTD XHTML  l.0  Transitional//EN¨
    Hhttp://www.w3.org/T R/xh tmll/DTD/xhtmll-七ran sitional.dtd’’>
    <html xmlns=¨http: //www. w3. org/1999/xhtml">
    <head>
    <meta http-equiv=¨Content-Type¨content=’’text/html; charset=utf-8’’/>
    < title>
    南昌良良母婴用品有限公司官网一主营母婴用品婴幼儿日用品婴幼儿床上用品婴儿枕头尿垫
    围嘴睡袋凉席
    </title>
    <link type=¨text/css" rel=¨stylesheet" href-¨../styles/commonl.css"/>
    <meta name=”Keywords”content=”婴儿枕头,婴幼儿日用品,儿童枕头,保健枕头,婴儿
    凉席,围嘴,尿垫,睡袋,宝宝睡眠”1>
    <meta name=”Description”content=”南昌良良母婴用品有限公司生产的苎麻系列婴幼儿
    用品荣获国家多项专利,被誉为中国婴童保健用品专家。主营婴幼儿日用品、婴幼儿床上用品、
    婴儿枕头,儿童枕头,成人枕头,保健枕头等枕头软家居用品,还有婴儿围嘴、凉席、尿垫、睡
    袋等婴幼儿日用品。
    ¨/>
    <l--由中企动力科技集厨股份有限公司南昌分公司技术部设计制作<br>如果您有任何意见或建
    议请电邮dm-nanchang@ce.net.cn一一>
    </head>
    <body>
    <div class-"index-a">
    <.bject classici=”clsid: D2 7CDB 6E-AE 6D-llcf-9 688-44 4553 54 0000"
    codebas e=" ht tp:  //download. ma crome dia. com/pub/s hockwave/cabs/fla sh/swfl
    ash.cab#version=7 r 0,19,0。’width=’’980’’height=’‘600’’>
    <param name=”movie¨value=¨../images/intro. swf’’  />
    <param name-"quality" value-"hicjh"/>
    <param name="wmode- value="transparent"  />
    <embed   srC="-. /imacjes/intro. swf"   quality=’’high‘一
pluginspage-"http: //www. mac romedia. com/go/get flas hpla yer"
t ype=" application/x_ shockwaVe- flash 7'   width="9 80 7'   height=-r 600-. ></embed>
    </obj ect>
<div>
    <div align="center"  style= "padding-top:2 Spx;”>联系地址:江西省南昌市八一
大道4 61号(省医学院内)医科所附i楼
    <br/>
  版权所有:南昌良良母婴用品有限公司<a href="http://nanchang.ce.net.cn"
target-"' blank">中企动力提供技术支持</a>l  <a
hre f="h七tp://www, miibeian. gov.cn/"   target="_blank¨>赣工CP备05010033号
</a><script src!’’
h七七p: //s9-cn zz-com/s tat. php?id=20 4 720 4 &we b_id=2 04 720 4&show-picl"
Language=" Ja vaS crip七’’></script></div>
  </div>
</div>
</body>
</html>   

    搜索引擎蜘蛛访问首页后,完全没有任何一个链接能通向内页,倒是有指向网站设计月瞪务商及备案网站的链接。搜索引擎既不能抓取和索引Flash中的文字内容,也不能跟踪链接爬到内页。如果不给内部页面直接造些外链的话,整个网站能被收录的基本上只有首页一个页面,其内容还不能被索引。
    单击左侧婴儿保健用品链接(Flash中的链接)进入内页    看起来设计不错。可惜的是,除了左下角的新闻中心部分,页面上的其他文字、图片还是一个大Flash,包括顶部的导航条。所以就算站长给这个婴儿用品页面造一些外链,收录又到此为止了。企业概况、商品中心、在线商城等重要部分的页面还是没有任何爬行通路。
    左下角的新闻中心设计也有些奇怪,鼠标放上去时才显示链接,而且只显示了一半,单点击第一篇新闻中心文章后来到别一个页面.
    顶部导航依然是Flash,从新闻中心爬到产品页面也不可能了。另一个可怕的地方是 URL,读者可以在抓图地址栏中看到一部分。下面是HTML代码的相应部分,读者可以看到完整的网址。
   

<a
    hrf f-" /InfoContent/id:b4 9e4b4 4—5f38-413d-ao c2 -bfc2edb7 af2e&comp_stats=
    comp- Frontlnfo_li stByAs yncWit hOutAj ax-12 3.html”title=¨良良第十一届京正·
    北京孕婴童用品展览会”target=”一blank“)    良良第十一届京正叫E一.</a>
    这种URL就算有外部链接,想被收录也难。
同样,导航还是Flash。值得欣慰的是左侧产品链接是普通HTML链接,不过单击任何一个产品都可以看到长长的URI,
    带有这么多参数的URL,被收录的可能性很低,除非是个权重非常高的网站。这些链接相应的HTML代码如下:
    <div class="abouts sidebarlr'>
    <h4><a
    href="/ProductExhibitlist/&categoryid=b fb98cc0- 98 90-4e5 4 -b7a7—26bf85d0
    6280&comp_ s tat s=comp -FrontProductCategor y_showTree-ll0.html.’≥苎麻保健枕
    </a></h4>
    <h4><a
    hre f= t'/ProductExhibitli st/&categoryid:5 6f6b9 71- 9021-4 04 4 -bccf- fbece16b
    155a&comp_stats=c omp-Front ProductCategary_showT ree-ll0,html.’>苎麻保健袜
    </a></h4>
    <h4><a
    href="/ProductExh Uoitlist/&categoryid=f2 6 57 c17-ac5 8-4 9c6-84cc-3fc14 528
    Occa&comp_stats=comp- Front ProductCategary_showTree-ll0。html¨>苎麻保健凉
    席</a></h4>
    <h4><a
    hre f="/ProductExhibitlist/&ca tego ryid:e 00 0a2 5d-b 6c2-4 0b2 -b47 4-952ac4 40
    c8b8占comp_stat s-comp- Front ProductCategory_showTree_ll0.html’’>纯蚕丝被&睡
    掌l </a></h4>
    <h4><a
    href=’’/ProductExhibitlist/&categoryid:c4 00edfc-2 fla-4 9de-8b 6f- 7bOIB13f
    2842 &comp_stats=comp- Front ProductCate cjory_showTree-ll0.html’’>苎麻抗菌床
    单</a></h4>
    <h4><a
    href=”/ProductExhibitlist/&categoryid=4 650 7f4 0-93 84 -438f-8 7aO-f9 95be 9e
    7ea6 &comp_s tat s=comp- Front ProductCategory_showTree_ll0.html。1>礼包&帽子
    </a></h4>
    <h4><a
    hre f=’’/ProductExhibitlist/&categoryid= 9bed3 f9c-7a 41-43 9c-be12 -018 c4 f15
    97c 6&comp_stats=comp-Front ProductCategory_showTree_ll0.html">苎麻浴孕用
    巾</a></h4>
——~    <h4><a
    hre f="/ProductExhibitlist/&categoryid-3 4ef2bd6-ebb6-4 6d4 - 90 7e-9d0 922 5a
    ccc9 &comp_s tat s=comp - Fron tProductCategory_showT ree-ll0.html‘’>苎麻围嘴食
    饭衣</a></h4>
    <h4><a
    href= "/ProductExhibitlis t/&categoryid=dld7132d-17 4a-4079—9e010 -dd68 fOe7
    lb95&comp_stats=comp- Front ProductCategory_showTr ee-ll0.html">苎麻抗菌尿
    垫床垫</a></h4>
    <h4><a
    href=’’/ProductExhibitlist/&categoryid_19 0a4b2d-02 f8-4 e20-92d0-34 4 97acd
    333 f&comp_s tats=comp-FrontProductCategory_show'r ree-ll0.htnil">甲壳素系列
    </a×/h4>
    </div>
    对比首页、商品中心首页及产品页面标题.大家可以看到这个网站上除了新闻中心的几个页面之外,其他所有页面包括企业概况、商品中心、在线商城、在线调查等页面标题
全都一样。
    读者看到本书再去访问时,这个网站也许已经不是这个样子了。这是一个典型的搜索引擎不友好的企业网站,只考虑到视觉设计,完全没顾及到怎样被搜索引擎收录,怎样获得搜索流量。读者看学到一定的程度后,再回头看一遍这个例子,会更了解这个网站为什么不搜索引擎友好,应该怎样改进。
请尊重我们的辛苦付出,未经允许,请不要转载SEO自学网的文章!
上一篇:网站核心关键词的确定
下一篇:避免蜘蛛陷阱