导航

  • 首页
  • Tags列表
  • 管理
  • 简繁转换
Search Engine Optimization 站外搜索 站内搜索
« 看看微软帝国是怎么发家的休闲:Sogou文学水平测试系统 »

Google Webmaster Tools

Google Webmaster Tools经过了两次次升级,现在提供的服务个人认为非常实用,可以在一定程度上对网站进行优化,每位站长值得一试,推荐一下:-)在这里我只针对“诊断”和“sitemaps”这两部分功能做一介绍,希望对大家能所帮助。

先来说说Sitemaps,顾名思意,就是站点地图,Sitemaps可以让网站更容易被 Google 抓取,提高网站的展示率,至于会不会提高网站在google中的排名,这一点不得而知,至少在google提供的帮助信息中没有说明这一点。我们可以根据google提供的帮助文档来自己制作sitemap文件,但是自己制作sitemap文件非常繁琐,至少我是这么认为的,实际上现在有很多自动生成sitemap文件的小软件了,大家可以去google一下,还有一种更简便的方法,使用 Sitemaps 协议的 Sitemaps 就是列有某个网站所有网址的 XML 文件,如果你的网站支持RSS订阅,直接把RSS.XML这个文件提交给google就行了,我就是就么干的:

“诊断”功能提供了一系列实用的服务项目,但前提是网站必须通过验证,google提供了两种验证方法:



但有时候验证会出现一出小问题:


这时我们所能做的也就只有等待,验证通过之后就可以享受google提供的服务了:



在图中可以看到我的站点中有很多死链接,主要是由于我中途换blog系统所至,导至以前网页链接失效了,在报表中还有一部分无法访问的网页链接实际上是有效链接,据我估计可能是由于我的虚拟空间所在的服务器数据负载过高造成的,(有时google在抓取sitemap文件时也会出现网络无法访问的错误,在这里可以看出选择一个稳定的服务器是多么的重要!)我们可以通过“robots.txt分析”来删除死链接.

搜索引擎通过一种程序robot(机器人)又称spider(网络蜘蛛),自动访问互联网上的网页并获取网页信息。我们可以在网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了。robots.txt文件应该放在网站根目录下,我这里简单(能力有限)说一下robots.txt文件的书写格式:

User-agent:
  该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个搜索引擎的robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中, "User-agent:*"这样的记录只能有一条。


Disallow:
  该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被 robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问 /help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。举一些例子:

例1. 禁止所有搜索引擎访问网站的任何部分:
User-agent: *
Disallow: /

例2. 允许所有的robot访问(和站点中没有robots.txt文件的效果是一样的):
User-agent: *
Disallow:

例3. 禁止google搜索引擎机器人的访问,但对其它搜索引擎不做任何限制:
User-agent: Googlebot
Disallow: /

例4. 只允许google搜索引擎的访问:

User-agent: Googlebot
Disallow:

User-agent: *
Disallow: /

例5. 删除某特定文件类型的所有文件(例如:.gif):
User-agent:Googlebot
Disallow:/*.gif$

例6. 删除动态生成网页,应使用此 robots.txt 条目:
User-agent:Googlebot
Disallow:/*?
大家可以跟据自己的需求制订自己的robots.txt文件,然后可以用工具栏的“robots分析”来进行测试,“robots分析”工具中有上下两个文本框,上一个文本框用来放robots.txt文件中的内容,下一个文本框用来输入指定目标链接,测试是否被删除,测试没有错误后,再上传到网站空间中。

Google Webmaster Tools现在可以指定googlebot对站点的抓取速度:
1.更快 较快的抓取速度可让我们更快抓取您的网站,但也会给您的服务器造成负担。
2.正常 建议抓取速度。
3.更慢 较慢的抓取速度可减少 Googlebot 对您的服务器的点击量,但也会造成我们抓取您的网站的频率过低。
Googlebot的活动记录以报表的呈现,不过好像有一个小bug,在图中我标出来了:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Search



  • 互联网 站内搜索

最新留言

最近发表

站点统计

  • 文章总数:280
  • 评论总数:249
  • 引用总数:0
  • 浏览总数:540154
  • 当前样式:default
  • 当前语言:zh-CN

图标汇集

  • 订阅到抓虾
    新闻蚂蚁
    周博通
    订阅到狗狗
    google reader
    bloglines
    my yahoo
    newsgator
    netvibes
    Rojo
  • 通过 W3C XHTML 1.0 Transitional 校验
  • 通过 W3C CSS 校验
  • 订阅本站的 ATOM 1.0 新闻聚合
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-Blog 1.6 Final Build 60802

Copyright Yufuzi Some Rights Reserved.
E-mail:yufuzi80@126.com QQ:20168130
备案序号:苏ICP备06015492号