robots最详尽、最易懂说明及写法

robots介绍：

很多做优化的忽略robots的重要性，我们首先要记住的就是蜘蛛来到网站之后第一个看的就是robots文件，它是搜索引擎的协定，告诉蜘蛛哪些能抓，哪些不能抓，哪些目录下的哪些文件可以抓，这些robots文件都可以实现。

robots规则说明：

1、 * 代表所有的意思

3、Disallow 列出的是要禁止抓取的的网页和规则，后面用/代表层次关系

Disallow：/(代表着禁止抓取网站所有内容)

Disallow: /abc(禁止抓取abc及其层次下的内容)

Disallow: /abc/(禁止抓取abc层次下的内容，但是允许抓abc)

Disallow: /*.png(禁止抓取png的图片，其他格式的也这样写比如禁止抓网站中的PPT后缀文件是Disallow：/*.PPT)

Disallow: /abc/*.png(禁止访问abc层次下的PNG图片，其他格式也是)

Disallow: /*?*(屏蔽站内所有动态URL，因为动态地址都带?所有可以用这种形式，其他的字符也可以)

4、Allow 代表允许访问抓取的意思

Allow一定放在disallow的前面才能不受disallow的影响，比如禁止所有动态后，想要排除一个栏目，写法如下：

Allow: /abc

disallow: /*?*

其他的写法参考disallow的逻辑

5、sitemap 这个只用于告诉蜘蛛网站地图在哪

sitemap: 网址/sitemap.xml 必须写绝对路径

6、Crawl-delay 控制抓取频次，一般有些搜索蜘蛛频繁抓取网站，会对服务器造成很大的负担，这个就是用来控制抓取频次的。

User-agent： 360Spider

Crawl-delay： 10

这句是说，360你抓的太频繁，你抓过之后10秒之后才能下一次抓取。

注意“命令：后“面要加个空格。