我的网站拥有几千万个网址;我可以只提交最近更改过的网址吗?
您可以在少数频繁更改的 Sitemap 中列出已更新的网址,然后使用 Sitemap 索引文件中的 lastmod 标记识别这些 Sitemap 文件。随后,百度即可逐步抓取这些已更改的 Sitemap。
我的 Sitemap 可以有多大?
单个Sitemap 应该小于 10MB(10,485,759字节),所包含的网址数最多为 50,000 个。如果您网站包含的网址超过 50,000 个或您的 Sitemap 超过 10MB,则需要创建多个 Sitemap 文件,并且需要使用 Sitemap 索引文件。Sitemap 索引文件应该小于 10MB(10,485,759字节),且最多可以包含1000个sitemap。
应该将 Sitemap 文件放在哪里?
建议将 Sitemap 放在 HTML 服务器的根目录中,即 http://www.example.com/sitemap.xml。某些情况下,例如您公司网站允许对应不同的目录划分写入权限,这时您或许希望在网站上针对不同的路径创建不同的 Sitemap。如果您有上传到 “http://www.example.com/路径/sitemap.xml” 的权限,那么您可以针对 “http://www.example.com/路径/” 创建不同的sitemap 。
Sitemap协议类型及包含范围
百度Sitemap协议支持提交收录网页列表以及死链列表。收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及Sitemap索引文件提交。死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。死链列表目前只能使用文本格式在百度站长平台提交。
百度Sitemap协议
百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。