Home >Backend Development >XML/RSS Tutorial >Teach you step by step how to create a Google Sitemap (detailed production tutorial and protocol explanation)

Teach you step by step how to create a Google Sitemap (detailed production tutorial and protocol explanation)

黄舟
黄舟Original
2017-03-02 17:03:242697browse



熬了半个通宵,写出了自己的Google SiteMap文件,在这里给出详细编写教程,愿对大家有所帮助。

Google SiteMap的作用及协议格式详解

Google SiteMap PRotocol是Google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的xml格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。

Google SiteMap文件生成后格式如下:

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
  <url>
    <loc>http://www.knowsky.com</loc>
    <lastmod>2005-06-03T04:20-08:00</lastmod>
    <changefreq>always</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://www.knowsky.com/300687.html</loc>
    <lastmod>2005-06-02T20:20:36Z</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>XML标签

changefreq:页面内容更新频率。

lastmod:页面最后修改时间

loc:页面永久链接地址

priority:相对于其他页面的优先权

url:相对于前4个标签的父标签

urlset:相对于前5个标签的父标签

我将一句一句分解讲解这个xml文件的每一个标签:

6d73c223feccdcd047616613a360f0ad这一行定义了此xml文件的命名空间,相当于网页文件中的100db36a723c770d327fc0aef2ce13b1标签一样的作用。

9bb6a7d109b3f2bf35f7e2e9bd87f98a这是具体某一个链接的定义入口,你所希望展示在SiteMap文件中的每一个链接都要用9bb6a7d109b3f2bf35f7e2e9bd87f98a和900f1908732f5dc023563361c92a4eee包含在里面,这是必须的。

ca088a1fcf373d44834ffd3092a0a6a8http://www.knowsky.comf7863ca7ed6c13a2182e8808be9ba40f用ca088a1fcf373d44834ffd3092a0a6a8描述出具体的链接地址,这里需要注意的是链接地址中的一些特殊字符必须转换为XML(HTML)定义的转义字符,如下表:

字符           转义后的字符     HTML字符       字符编码

and(和)             &               &              &    

单引号             '         '             '    

双引号                "               "              "    

大于号                >               >                   >    

小于号                 5a5fb53356d1730688bf8825aa0f3da22005-06-03T04:20:32-08:003c6e3022d222976816008aeb896dbda9a05a23a41666355d84d5fbbb1dc80976是用来指定该链接的最后更新时间,这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了

年:YYYY(2005)

年和月:YYYY-MM(2005-06)

年月日:YYYY-MM-DD(2005-06-04)

年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)

年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)

1488e1decd6831cb4f355ae035bb5752always8e49cb5daaeee1af0f2fa011775fcf76用这个标签告诉Google此链接可能会出现的更新频率,比如首页肯定就要用always(经常),而对于很久前的链接或者不再更新内容的链接就可以用yearly(每年)。这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单词的意思就明白了。

787ce0d5fe0b2ba956175af055fe2e6d1.0ae7e1b9df34f14ea8ed501424abf5214787ce0d5fe0b2ba956175af055fe2e6d是用来指定此链接相对于其他链接的优先权比值,此值定于0.0 - 1.0之间

还有900f1908732f5dc023563361c92a4eee和8d2ae7c9f6999e099a48ed4c406bcde0,这两个就是来关闭xml标签的,这和HTML中的36cc49f0c466276486e50c850b7e4956和73a6ac4ed44ffec12cee46588e518a5e是一个道理

Another thing to note is that this xml file must be in utf-8 encoding format. Whether you generate it manually or through code, it is recommended to check whether the xml file is utf-8 encoded. The simplest way is Open the xml with notepad and then select the encoding (or converter) to UTF-8 when saving.

Log in to Google to submit your SiteMap file and let Google start crawling. Open the

https://www.google.com/webmasters/sitemaps/ link. If you have not registered or logged in to Google, Just log in to Google with your own account. After logging in, go to the Your Sitemaps status page. You can click Add a Sitemap + to jump to the submission page to submit the Sitemap file. It is recommended that the file be placed in the root directory of your site. After submitting your Sitemap URL to Google, you can see that it already exists in the list, but it has not taken effect yet. It will take a few hours for the Status column to change to OK to officially take effect. If it is not OK, you can check the status indicator given by Google. Explain the reason.

The above is a step-by-step guide to making Google Sitemap (detailed production tutorial and protocol explanation). For more related content, please pay attention to the PHP Chinese website (www.php.cn)!


Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn