51.com的robots.txt有错吗?
|
源代码网整理以下什么是robots.txt文件? 源代码网整理以下 源代码网整理以下 源代码网整理以下我仔细看了51的robots.txt而最后要驳反“眼镜蛇”的判断和定论! 源代码网整理以下每个站点都必须要有robots.txt吗? 源代码网整理以下不一定,看情况 源代码网整理以下那么robots.txt是针对任何搜索引擎吗? 源代码网整理以下不一定,搜索引擎的概念是什么先搞明白!至少他有蜘蛛,并且遵循robots.txt语法。像百度,google,yahoo都遵循 源代码网整理以下robots.txt放在哪里? 源代码网整理以下根目录下,就是通过 http://www.abc.com/robots.txt等浏览访问到的! 源代码网整理以下robots.txt怎么写? 源代码网整理以下请查询:http://www.robotstxt.org/ 源代码网整理以下因为眼镜蛇说百度杀了51是因为51的robots.txt 源代码网整理以下“51.com搜索消失原因是公司想借机炒作?” 源代码网整理以下(联系到五一国庆左右百度大规模检查并封杀作弊网站,开始让业界以为51.com是百度惩罚的网站之一, 源代码网整理以下郁闷一:五一成“国庆”了! 源代码网整理以下郁闷二:robots.txt写法遵循规则,搜索引擎也给予遵循!那么就是眼镜蛇以上文章的判定错误!不是51的robots.txt错误! 源代码网整理以下 源代码网整理以下因为51的主页都在home下或者这个二级玉米下,那么就这个来说! 源代码网整理以下 源代码网整理以下Disallow: /home/ (假设只针对百度,因为google 没把51怎么着,而之后分析则套用google的一些现象对比百度,除非他们不是一样性质的遵循robots.txt的搜索引擎!) 源代码网整理以下百度给出的定义: 源代码网整理以下"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html 源代码网整理以下http://www.baidu.com/search/robots.html 源代码网整理以下那么就是说在http://www.51.com/home/index.htm/index.html/index.shtml不能被收录,因为home目录下无主页! 源代码网整理以下http://www.51.com/home/index.htm 404错误 源代码网整理以下确定HOME下无默认首页文件,一般都是404页,这样多搜索引擎会很不友好的,那么当然仔细点的站点都会杜绝被搜索引擎视为死连接。 源代码网整理以下判定:Disallow: /home/ 对于百度正确! 源代码网整理以下因为有:User-agent: * (针对所有搜索) 源代码网整理以下查看:site:51.com/home ,site:51.com/home/ ,site:www.51.com/home , site:www.51.com/home/ 源代码网整理以下目前看不见百度的现象,根据User-agent: * (针对所有搜索)说明百度当时也是这样!(80%一样) 源代码网整理以下再查:site:home.51.com 源代码网整理以下第一结果为 源代码网整理以下51 博客网欢迎您home.51.com/ - 类似网页 源代码网整理以下似乎home.51.com/下有首页,似乎home目下也有首页! 源代码网整理以下我们点过去则跳转到http://www.51.com/,因为目前搜索引擎都可以识别和收录url转发而非跳转! 源代码网整理以下随便查下home.51.com/的站点访问使用情况! 源代码网整理以下比如:第二结果 源代码网整理以下献给我最爱的00 源代码网整理以下home.51.com/home.php?user=nicolelove - 5k - 补充材料 - 网页快照 - 类似网页 源代码网整理以下而你使用“http://nicolelove.51.com ”也访问的是此“home.51.com/home.php?user=nicolelove” 源代码网整理以下也可以 :http://www.51.com/home/Index.php?user=nicolelove (home下的任何其他文件可以收录和访问) 源代码网整理以下也可以:http://51.com/home/Index.php?user=nicolelove 访问而到http://www.51.com/home/Index.php?user=nicolelove 源代码网整理以下也可以:http://www.51.com/home.php?user=aiyoweiyaaaa到http://home.51.com/home.php?user=aiyoweiyaaaa 源代码网整理以下严格按照URL说这个可以说是多URL或者路径重叠,或者混乱,只是一些没告诉那些站长,只告诉站长 源代码网整理以下补充: 源代码网整理以下<*** LANGUAGE="Java***"> 源代码网整理以下看下最后第三段代码! 源代码网整理以下搜索引擎在更多时是不允许这样的现象的。二级玉米和独立玉米都可以认为不同域下的站点和网页! 源代码网整理以下比如:http://piaoge999.51.com 这个是不存在申请的url站站点,那么你输入回车后就会提示:该用户不存在 源代码网整理以下提示URL为:http://home.51.com/home.php?user=piaoge999 源代码网整理以下点确定立即返回到“http://www.51.com/”这样的做法稍微比404错误返回友好了一些,可是假如我今天申请了,明天51删除我了, 源代码网整理以下在http://www.yookee.org/dispbbs_17_313_1.htm“SEO优化之“不要轻易使用泛解析” 特别拿51来分析了的! 源代码网整理以下只是没这个写的详细,而这个文章飘哥则做了70%的分析列举说明。要说明的是51被封是联系到了滥用泛解析! 源代码网整理以下而反驳“眼镜蛇”的是针对他说51的robots.txt的问题造成被封!而51的robots.txt写法符合和遵循! 源代码网整理以下飘哥到今天还没使用过robots.txt,只是之前帮一个朋友从google拒绝收录而找历史记录发现他的玉米曾经存在robots.txt 源代码网整理以下 |
