当前位置:首页 > 网站运营 > seo搜索优化 > > 如何写Robots.txt

如何写Robots.txt

点击次数:52 次 发布日期:2008-11-12 16:14:03 作者:源代码网
源代码网推荐

源代码网整理以下  搜索引擎Robots协议,是放置在网站根目录下robots.txt文本文件,在文件中可以设定搜索引擎蜘蛛爬行规则。设置搜索引擎蜘蛛Spider抓取内容规则。下面Seoer惜缘举例robots写法规则与含义:

源代码网整理以下  首先要创建一个robots.txt文本文件,放置网站的根目录下,下面就开始编辑设置Robots协议文件:

源代码网整理以下  一、允许所有搜索引擎蜘蛛抓取所以目录文件,如果文件无内容,也表示允许所有的蜘蛛访问,设置代码如下:

源代码网整理以下  User-agent: *

源代码网整理以下  Disallow:

源代码网整理以下  或者

源代码网整理以下  User-agent: *

源代码网整理以下  Allow: /

源代码网整理以下  二、禁止某个搜索引擎蜘蛛抓取目录文件,设置代码如下:
  
        User-agent: Msnbot
       Disallow: /
 

源代码网整理以下  User-agent: Msnbot

源代码网整理以下  Disallow: /

源代码网整理以下  例如想禁止MSN的蜘蛛抓取就设为,Msnbot代表MSN的蜘蛛,如果想禁止其他搜索引擎就更换蜘蛛名字即可,其他蜘蛛名字如下:

源代码网整理以下  百度的蜘蛛:baiduspider

源代码网整理以下  Google的蜘蛛: Googlebot

源代码网整理以下  腾讯Soso:Sosospider

源代码网整理以下  Yahoo的蜘蛛:Yahoo Slurp

源代码网整理以下  Msn的蜘蛛:Msnbot

源代码网整理以下  Altavista的蜘蛛:Scooter

源代码网整理以下  Lycos的蜘蛛: Lycos_Spider_(T-Rex)

源代码网整理以下  三、禁止某个目录被搜索引擎蜘蛛抓取,设置代码如下:

源代码网整理以下  User-agent: *

源代码网整理以下  Disallow: /目录名字1/

源代码网整理以下  Disallow: /目录名字2/

源代码网整理以下  Disallow: /目录名字3/

源代码网整理以下  把目录名字改为你想要禁止的目录即可禁止搜索引擎蜘蛛抓取,目录名字未写表示可以被搜索引擎抓取。

源代码网整理以下  四、禁止某个目录被某个搜索引擎蜘蛛抓取,设置代码如下:

源代码网整理以下  User-agent: 搜索引擎蜘蛛名字 说明(上面有说明蜘蛛的名字)Disallow: /目录名字/ 说明(这里设定禁止蜘蛛抓取的目录名称)例如,想禁目Msn蜘蛛抓取admin文件夹,可以设代码如下:

源代码网整理以下  User-agent: Msnbot

源代码网整理以下  Disallow: /admin/

源代码网整理以下  五、设定某种类型文件禁止被某个搜索引擎蜘蛛抓取,设置代码如下:

源代码网整理以下  User-agent: *

源代码网整理以下  Disallow: /*.htm 说明(其中“.htm”,表示禁止搜索引擎蜘蛛抓取所有“htm”为后缀的文件)

源代码网整理以下  六、充许所有搜索引擎蜘蛛访问以某个扩展名为后缀的网页地址被抓取,设置代码如下:

源代码网整理以下  User-agent: *

源代码网整理以下  Allow: .htm$ 说明(其中“.htm”,表示充许搜索引擎蜘蛛抓取所有“htm”为后缀的文件)

源代码网整理以下  七、只充许某个搜索引擎蜘蛛抓取目录文件,设置代码如下:

源代码网整理以下  User-agent: 搜索引擎蜘蛛名字 说明(上面有说明蜘蛛的名字)

源代码网整理以下  Disallow:

源代码网整理以下  作者: Seoer惜缘 原载网址: http://www.noseo.org.cn/ 版权所有,转载时必须以链接形式注明作者和原载网址及本声明。站长网新闻榜 www.admin5.com/top

源代码网供稿.
网友评论 (0)
会员中心
网站运营
本站推荐
网站运营之精华