百度sitemap协议相关

  百度sitemap协议
    百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。 百 度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap 索引文件提交。每个sitemap文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。
XML格式sitemap说明:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>
   <urlset>
        <url>
          <loc>http://www.example.com/</loc>
          <lastmod>2010-01-01</lastmod>
          <changefreq>always</changefreq>
          <priority>1.0</priority>
        </url>
   </urlset>

具体格式及规范说明请查看: http://sitemap.baidu.com/sitemap/format/

XML标签说明:

属性
是否必填项
说明
<urlset> 必填 只填写 <urlset>
<url> 必填 每个网址记录的父标记。
<loc> 必填 该页的网址。该值必须少于256个字节。
<lastmod> 可选 该文件上次修改的日期。
<changefreq> 可选 页面可能发生更改的频率。有效值为:

  • always
  • hourly
  • daily
  • weekly
  • mothly
  • yearly
  • never
<priority> 可选 此网页的优先级。有效值范围从 0.0 到 1.0。

 

文本格式sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:

  • 文本文件每行都必须有一个网址。网址中不能有换行。
  • 您必须指定完整的网址,包括 http。
  • 每个文本文件最多可包含 50,000 个网址,并且 应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
  • 文本文件需使用 UTF-8 编码或GBK编码。
  • 文本文件不应包含网址列表以外的任何信息。

 

使用sitemap索引文件(对多个sitemap文件)说明:

    您可以使用 gzip 压缩 sitemap 文件,以减少带宽要求;但是解压缩后的 sitemap 文件应小于10MB(10,485,760字节)。使用sitemap 索引文件必须:

  • <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
  • 每个 sitemap 包含一个 <sitemap> 条目作为 XML 父标记。
  • 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

sitemap索引文件标签说明:

属性
是否必填项
说明
<sitemapindex> 必填 压缩文件中所有sitemap的相关信息
<sitemap> 必填 压缩文件中个别sitemap的相关信息
<loc> 必填 识别sitemap的位置
<lastmod> 可选 识别相对sitemap文件的修改时间

  sitemap协议类型及包含范围
  • 百度sitemap协议支持提交收录网页列表以及死链列表。    收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及sitemap索引文件提交。
        死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。
        死链列表目前只能使用文本格式在百度站长平台提交。
  • sitemap文件的包含范围以主域为单位。    如果您验证了 http://www.example.com/这个网站,那么sitemap文件中可以包含http://www.example.com/、 http://example.com/、http://bbs.example.com/等所有example.com主域下站点中的网址。

  • 发表评论?

    0 条评论。

    发表评论


    注意 - 你可以用以下 HTML tags and attributes:
    <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>