当前位置：SEO自学网 > 网站SEO优化教程 > 网站结构优化 > robots.txt文件的格式

robots.txt文件的格式

admin2022年03月31日 21:20:25网站结构优化345

"robots.txt"文件包含一条或更多的记录，这些记录通过空行分开（以CR,CR/NL, or NL作为结束符），每一条记录的格式如下所示：

"<field>:<optionalspace><value><optionalspace>"。

在该文件中可以使用#进行注解，具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始，后面加上若干Disallow行,详细情况如下：

User-agent:

该项的值用于描述搜索引擎robot的名字，在"robots.txt"文件中，如果有多条User-agent记录说明有多个robot会受到该协议的限制，对该文件来说，至少要有一条User-agent记录。如果该项的值设为*，则该协议对任何机器人均有效，在"robots.txt"文件中，"User-agent:*"这样的记录只能有一条。

Disallow:

该项的值用于描述不希望被访问到的一个URL，这个URL可以是一条完整的路径，也可以是部分的，任何以Disallow开头的URL均不会被robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问，而"Disallow:/help/"则允许robot访问/help.html，而不能访问/help/index.html。任何一条Disallow记录为空，说明该网站的所有部分都允许被访问，在"/robots.txt"文件中，至少要有一条Disallow记录。如果"/robots.txt"是一个空文件，则对于所有的搜索引擎robot，该网站都是开放的。

Allow:

该项的值用于描述希望被访问的一组URL，与Disallow项相似，这个值可以是一条完整的路径，也可以是路径的前缀，以Allow项的值开头的URL是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的，所以Allow通常与Disallow搭配使用，实现允许访问一部分网页同时禁止访问其它所有URL的功能。

需要特别注意的是Disallow与Allow行的顺序是有意义的，robot会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL。

使用"*"和"$"：

robots支持使用通配符"*"和"$"来模糊匹配url：

"$" 匹配行结束符。

"*" 匹配0或多个任意字符。

扫描二维码推送至手机访问。

本文链接：http://www.seozixuewang.com/post/364.html

标签: Robots

返回列表

上一篇：robots.txt文件放在哪里?

下一篇：robots.txt使用教程

“robots.txt文件的格式” 的相关文章

robots.txt文件放在哪里?2022年03月31日 21:19:37

巧用robots文件管理引导搜索引擎蜘蛛对网站的抓取2022年04月01日 21:58:37

Robots文件的作用和规范写法2022年04月29日 10:19:11

禁止搜索引擎收录的方法2022年05月04日 10:31:25

关于robots.txt的二三事2022年05月06日 20:29:16

robots简介2022年05月06日 20:34:36

robots使用误区2022年05月06日 20:35:06

robots.txt语法教程2022年05月06日 20:36:28

SEO自学网

robots.txt文件的格式

“robots.txt文件的格式” 的相关文章

网站导航：网站结构优化 网站页面优化 外部链接建设 网站内容建设 关键词优化 移动搜索优化 搜索引擎算法 seo技术提升 seo推广 Sitemap：xml地图 txt地图站长QQ号：353627218冀ICP备14008345号

网站导航：网站结构优化网站页面优化外部链接建设网站内容建设关键词优化移动搜索优化搜索引擎算法 seo技术提升 seo推广
Sitemap：xml地图 txt地图
站长QQ号：353627218
冀ICP备14008345号