XML Sitemap 优化:超越基础提交
XML sitemap 是最容易实现的技术 SEO 要素之一,但它们却经常未被充分优化。一份结构良好的 sitemap 所做的远不止于告知搜索引擎你的页面。它还传达了优先级、新鲜度以及内容之间的关系,这些都能影响搜索引擎发现和索引你内容的效率。
什么造就了一份优秀的 Sitemap
只包含规范 URL
你的 sitemap 应当只包含规范(canonical)URL。如果某个页面的 canonical 指向了别处,那么应该把那个 canonical 目标放进 sitemap 中。在 sitemap 中包含非规范 URL 会发出相互冲突的信号,并浪费抓取资源。
每个 Sitemap 保持在 50000 个 URL 以内
每个 sitemap 文件最多可包含 50000 个 URL,且未压缩大小必须小于 50MB。对于更大的站点,应创建一个引用多个 sitemap 文件的 sitemap 索引文件。按内容类型、板块或语言对 sitemap 进行合理拆分。
准确的 Lastmod 日期
lastmod 元素应当反映页面内容实际发生变化的时间,而非 sitemap 生成的时间。不准确的 lastmod 日期会让搜索引擎逐渐学会忽略你的新鲜度信号。只在你做出实质性内容变更时才更新 lastmod。
进阶 Sitemap 策略
Sitemap 分段
按内容类型拆分 sitemap:一个用于博客文章,一个用于产品页面,一个用于分类页面,一个用于落地页。这样你就能在 GSC 中按内容类型监控索引覆盖情况,并识别索引问题中的规律。
News Sitemap
Google News 要求使用一种独立的新闻专用 sitemap 格式,其中包含额外的元素,例如出版物名称、语言和访问类型。News sitemap 应当只包含过去 48 小时内发布的文章,并应频繁更新。
视频与图片 Sitemap
视频 sitemap 包含针对视频内容的额外元素,例如标题、描述、缩略图 URL、时长和内容 URL。图片 sitemap 则为页面条目添加图片专属信息。两者都能改善内容发现并启用富媒体搜索结果(rich results)。
监控 Sitemap 健康状况
定期监控可确保 sitemap 持续有效:检查 GSC 的 Sitemaps 报告中的错误和警告,核实已索引的 URL 数量是否符合预期,确保 sitemap 可访问且可解析,并验证 sitemap 中的 URL 与实际页面上的规范 URL 一致。
结论
XML sitemap 是一个简单却强大的工具,用于与搜索引擎沟通。一份维护良好的 sitemap 是一项低投入、高回报的技术 SEO 资产,能在抓取效率和索引覆盖方面带来持续的收益。