百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。 百 度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap 索引文件提交。每个sitemap文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。
XML格式sitemap说明:
XML格式举例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2010-01-01</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
具体格式及规范说明请查看: http://sitemap.baidu.com/sitemap/format/
XML标签说明:
|
属性
|
是否必填项
|
说明
|
<urlset> |
必填 |
只填写 <urlset> 。 |
<url> |
必填 |
每个网址记录的父标记。 |
<loc> |
必填 |
该页的网址。该值必须少于256个字节。 |
<lastmod> |
可选 |
该文件上次修改的日期。 |
<changefreq> |
可选 |
页面可能发生更改的频率。有效值为:
- always
- hourly
- daily
- weekly
- mothly
- yearly
- never
|
<priority> |
可选 |
此网页的优先级。有效值范围从 0.0 到 1.0。 |
文本格式sitemap说明:
您可以提供纯文本文件,其中每行包含一个网址。
文本文件格式举例:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=2
此文本文件需要遵循以下指南:
- 文本文件每行都必须有一个网址。网址中不能有换行。
- 您必须指定完整的网址,包括 http。
- 每个文本文件最多可包含 50,000 个网址,并且 应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
- 文本文件需使用 UTF-8 编码或GBK编码。
- 文本文件不应包含网址列表以外的任何信息。
使用sitemap索引文件(对多个sitemap文件)说明:
您可以使用 gzip 压缩 sitemap 文件,以减少带宽要求;但是解压缩后的 sitemap 文件应小于10MB(10,485,760字节)。使用sitemap 索引文件必须:
- 以
<sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
- 每个 sitemap 包含一个
<sitemap> 条目作为 XML 父标记。
- 每个
<sitemap> 父标记包含一个 <loc> 子标记条目。
sitemap索引文件标签说明:
|
属性
|
是否必填项
|
说明
|
| <sitemapindex> |
必填 |
压缩文件中所有sitemap的相关信息 |
| <sitemap> |
必填 |
压缩文件中个别sitemap的相关信息 |
| <loc> |
必填 |
识别sitemap的位置 |
| <lastmod> |
可选 |
识别相对sitemap文件的修改时间 |
|
0 条评论。