robots.txt详细介绍_HTML/Xhtml_网页制作-HTML Tutorial-php.cn

Home

Web Front-end

HTML Tutorial

robots.txt详细介绍_HTML/Xhtml_网页制作

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 16, 2016 pm 04:45 PM

metaintroducesearch enginerobotaccessdetailed

robots.txt基本介绍
robots.txt是一个纯文本文件，在这个文件中网站管理者可以声明该网站中不想被robots访问的部分，或者指定搜索引擎只收录指定的内容。
当一个搜索机器人（有的叫搜索蜘蛛）访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，那么搜索机器人就沿着链接抓取。
另外，robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。
robots.txt写作语法
首先，我们来看一个robots.txt范例：http://www.csswebs.org/robots.txt
访问以上具体地址，我们可以看到robots.txt的具体内容如下：
# Robots.txt file from http://www.csswebs.org
# All robots will spider the domain
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.csswebs.org站点下的所有文件。
具体语法分析：其中#后面文字为说明信息；User-agent:后面为搜索机器人的名称，后面如果是*，则泛指所有的搜索机器人；Disallow:后面为不允许访问的文件目录。
下面，我将列举一些robots.txt的具体用法：
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分（下例中的01、02、03目录）

User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问（下例中的BadBot）
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问（下例中的Crawler）
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
另外，我觉得有必要进行拓展说明，对robots meta进行一些介绍：
Robots META标签则主要是针对一个个具体的页面。和其他的META标签（如使用的语言、页面的描述、关键词等）一样，Robots META标签也是放在页面的＜head＞＜/head＞中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法：
Robots META标签中没有大小写之分，name=”Robots”表示所有的搜索引擎，可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项：index、noindex、follow、nofollow，指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面；
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去；
Robots Meta标签的缺省值是INDEX和FOLLOW，只有inktomi除外，对于它，缺省值是INDEX,NOFOLLOW。
这样，一共有四种组合：
＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞
＜META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”＞
＜META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”＞
＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞
其中
＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞可以写成＜META NAME=”ROBOTS” CONTENT=”ALL”＞；
＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞可以写成＜META NAME=”ROBOTS” CONTENT=”NONE”＞
目前看来，绝大多数的搜索引擎机器人都遵守robots.txt的规则，而对于Robots META标签，目前支持的并不多，但是正在逐渐增加，如著名搜索引擎GOOGLE就完全支持，而且GOOGLE还增加了一个指令“archive”，可以限制GOOGLE是否保留网页快照。例如：
＜META NAME=”googlebot” CONTENT=”index,follow,noarchive”＞

Statement

The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn

wapi是什么东西详细介绍Jan 07, 2024 pm 09:14 PM

wapi这个名词用户们可能在使用网络得时候见到过，但是对于一部分人来说肯定都不知道wapi是什么，下面就带来了详细介绍，帮助不知道小伙伴去了解。wapi是什么东西：答：wapi是无线局域网鉴别和保密的基础结构。这就像红外线和蓝牙等功能一样，一般都覆盖在办公楼等地方的附近。基本都是为一个小部门所有的，所以这个功能涉及的范围只有几公里。wapi相关介绍：1、wapi是无线局域网里面的一种传输协议。2、这款技术是可以去避免窄频带通信的问题，可以更好的去进行传播。3、仅仅只需要一个代码就可以去传送信号了

详解win11能否运行PUBG游戏Jan 06, 2024 pm 07:17 PM

pubg又称绝地求生，是一款非常经典的射击大逃杀类型游戏，从2016年火爆以来一直拥有非常多的玩家。在最近的win11系统推出后，就有不少玩家想要在win11上游玩它，下面就跟着小编来看看win11是否可以玩pubg吧。win11能玩pubg吗：答：win11可以玩pubg。1、在win11推出之初，因为win11需要开启tpm的缘故，所以导致很多玩家被pubg封号处理了。2、不过后来根据玩家的反馈，蓝洞方面已经解决了这个问题，目前已经可以在win11中正常玩pubg了。3、如果大家遇到了pub

Python函数介绍：exec函数的介绍及示例Nov 03, 2023 pm 02:09 PM

Python函数介绍：exec函数的介绍及示例引言：在Python中，exec是一种内置函数，它用于执行存储在字符串或文件中的Python代码。exec函数提供了一种动态执行代码的方式，使得程序可以在运行时根据需要生成、修改和执行代码。本文将介绍exec函数的使用方法，并给出一些实际的代码示例。exec函数的使用方法：exec函数的基本语法如下所示：exec

i5处理器是否能装win11详细介绍Dec 27, 2023 pm 05:03 PM

i5是英特尔旗下的一系列处理器，拥有到现在11代i5的各种不同版本，每一代都有着不同性能。因此对于i5处理器是否能够安装win11，还需要看是第几代的处理器，下面就跟着小编一起来分别了解一下吧。i5处理器能装win11吗：答：i5处理器能装win11。一、第八代及之后的i51、第八代及后续的i5处理器是能够满足微软的最低配置需求的。2、因此我们只需要进入微软网站，下载一个“win11安装助手”3、下载完成后，运行该安装助手，根据提示进行操作就可以安装win11了。二、第八代之前的i51、第八代之

edge快捷键的介绍Jul 12, 2023 pm 05:57 PM

在如今快捷的生活，为了提高工作效率，快捷键是必不可少的工作需求。快捷键是指按键或按键组合，可提供另一种方式来执行通常使用鼠标执行的操作。那么edge快捷键有哪些呢？edge快捷键的功能又有哪些呢？下面小编整理了一份edge快捷键的介绍，感兴趣的朋友们快来看看吧！Ctrl+D：将当前页面添加到收藏夹或阅读列表Ctrl+E：在地址栏中执行搜索查询Ctrl+F：在页面上查找Ctrl+H：打开历史记录面板Ctrl+G：打开阅读列表面板Ctrl+I：打开收藏夹列表面板(测试好像不起作用)Ctrl+J：打开

详细介绍电脑中的打印机驱动程序位置Jan 08, 2024 pm 03:29 PM

很多用户在电脑上安装了打印机驱动程序，但却不知道如何找到它们。因此，今天我为大家带来了详细介绍打印机驱动程序在电脑中的位置，对于还不了解的用户，快来看看吧打印机驱动在电脑哪里找重新撰写内容而不改变原义时，需要将语言改写为中文，不需要出现原句首先，建议使用第三方软件进行搜索2、在右上角找到"工具箱"3、在下方找到并点击“设备管理器”。改写后的句子：3、在底部找到并点击“设备管理器”4、然后打开“打印队列”，然后找到你的打印机设备。此次是你的打印机名称型号。5、右键打印机设备，就能够去更新或者卸载我

PHP函数介绍：strtr()函数Nov 03, 2023 pm 12:15 PM

PHP函数介绍：strtr()函数在PHP编程中，strtr()函数是一个非常有用的字符串替换函数。它用于将字符串中的指定字符或字符串替换为其他字符或字符串。本文将介绍strtr()函数的用法，并给出一些具体的代码示例。strtr()函数的基本语法如下：strtr(string$str,array$replace)其中，$str是要进行替换操作的原始字

玩游戏最好的win10版本介绍Jan 08, 2024 am 10:41 AM

在微软公司发布了win10系统之后，我们所知的就有好几种版本：家庭版、教育版、专业版、旗舰版等等。小编认为这些版本在性能上没什么差别，只是有些针对性的功能不同。那么小编今天就来跟大家聊一聊玩游戏用win10哪个版本最好吧~希望可以帮助到你。玩游戏用win10哪个版本最好答：玩游戏来说，这几个版本其实区别并不大。如果只是想要拿来打游戏的话，推荐win10家庭版。因为家庭版没有其他花里胡哨的功能，能够让性能主要集中在游戏方面。这个问题，首先要说的就是win10几个版本之间的区别。1、win10主要版

See all articles

Hot AI Tools

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress images for free

Clothoff.io

AI clothes remover

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

Repo: How To Revive Teammates

1 months agoBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Energy Crystals Explained and What They Do (Yellow Crystal)

2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: How To Get Giant Seeds

1 months agoBy尊渡假赌尊渡假赌尊渡假赌

How Long Does It Take To Beat Split Fiction?

4 weeks agoByDDD

R.E.P.O. Save File Location: Where Is It & How to Protect It?

4 weeks agoByDDD

Hot Tools

Atom editor mac version download

The most popular open source editor

mPDF

mPDF is a PHP library that can generate PDF files from UTF-8 encoded HTML. The original author, Ian Back, wrote mPDF to output PDF files "on the fly" from his website and handle different languages. It is slower than original scripts like HTML2FPDF and produces larger files when using Unicode fonts, but supports CSS styles etc. and has a lot of enhancements. Supports almost all languages, including RTL (Arabic and Hebrew) and CJK (Chinese, Japanese and Korean). Supports nested block-level elements (such as P, DIV),