如何优化 XML 站点地图以改善 SEO

2024 年 5 月 13 日|SEO 思考|预计阅读时间 ≈ 8 分钟

XML 网站地图必须是您的技术 SEO策略的关键部分。XML 网站地图有助于搜索引擎更有效地抓取您的网站。

在本指南中,我将介绍 XML 网站地图是什么,以及如何对其进行优化以提高您的 SEO 性能。

什么是 XML 网站地图?

XML 网站地图是一个为搜索引擎(如谷歌、必应和雅虎)提供要抓取的 URL 列表的文件。XML 网站地图可以包含为爬虫提供每个 URL 附加信息的属性。 站地图的良好概述和一些基本用例。

XML 网站地图对 SEO 为何重要?

XML 网站地图对 SEO 重要的原因有很多,但归根结底是 XML 网站地图有助于搜索引擎发现您的页面。

提供 XML 网站地图将确保您网站上的重要页面被有效地抓取。事实上,谷歌的网站管理员趋势分析师 Gary Illyes 在悉尼的搜索营销会议上说,Googlebot使用网站地图来发现内容。

80%的发现是通过跟踪链接,接近 20%是通过跟踪网站地图。 – 来源

关于抓取预算和 XML 网站地图的快速说明

请记住,网站地图为搜索引擎提供了要抓取的 URL 列表。因此,我们必须讨论什么是抓取预算以及它如何影响 XML 网站地图,这一点至关重要。 以下是谷歌对抓取预算的定义:

将抓取速率和抓取需求结合起来,我们将抓取预算定义为 Googlebot 能够且想要抓取的 URL 数量。 – 谷歌网站管理员博客

在 XML 网站地图的背景下,需要理解的重要一点是,Googlebot 只会抓取一定数量的 URL,这可能无法涵盖您的所有 URL。提供 XML 网站地图可以更有效地利用您的抓取预算,因为 Googlebot 会知道更多地抓取您在网站地图中提供的重要 URL,而不是低价值的 URL。

XML 网站地图不会完全阻止 Google 抓取低价值的 URL,但它为 Googlebot 应该关注的 URL 提供了一个指示。

在两年的时间里,RegionsJob 应对了通过微调其网站的内部链接结构以创建高效架构来提高其投资回报率的挑战。该策略专注于支持网站目标的 SEO 行动。基于页面盈利能力的关键绩效指标,RegionsJob 实施了修改,创建了一个具有更好用户转化率的网站。

将您的 XML 网站地图提交给搜索引擎

通过搜索引擎的站长工具控制台向搜索引擎提交您的 XML 网站地图是最佳实践。如果您无法访问,这里有一些设置指南:

通过这样做,您可以访问方便的数据,例如任何错误、上次抓取的日期以及发现的 URL 数量。有关更多详细信息,您可以阅读我的将您的网站提交给搜索引擎(如谷歌和必应)的指南。

XML 网站地图的类型

对于网络内容(例如图像和视频),有两种类型的 XML 网站地图:网站地图索引和网站地图文件。我将在下面简要介绍它们,但请务必查看主要搜索引擎的文档。

网站地图索引文件

网站地图索引文件简单来说就是您的网站地图的网站地图。您提供网站地图文件的位置以及其最后修改的时间。

1<?xml version="1.0" encoding="UTF-8"?> 2<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 3<sitemap> 4<loc>http://www.example.com/sitemap1.xml.gz</loc> 5<lastmod >2004-10-01T18:23:17+00:00</lastmod> 6</sitemap> 7<sitemap> 8<loc>http://www.example.com/sitemap2.xml.gz</loc> 9<lastmod>2005-01-01</lastmod> 10</sitemap> 11</sitemapindex>

网站地图文件

网站地图文件是您希望 Googlebot 抓取的 URL 列表。网站地图文件包含其他信息,例如最后修改日期、内容更改的频率以及 0.0 - 1.0 范围内的优先级。

1<?xml version="1.0" encoding="UTF-8"?> 2<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 3<url> 4<loc>http://www.example.com/</loc> 5<lastmod>2005-01-01</lastmod> 6<changefreq>monthly</changefreq> 7<priority>0.8</priority> 8</url> 9</urlset>

优化 XML 网站地图的 6 个技巧

除了拥有 XML 网站地图之外,您还可以做几件事来优化它以提高您的 SEO 性能。

1. 遵循 sitemaps.org 协议

在我们查看任何优化技巧之前,至关重要的是您的网站地图遵循 sitemaps.org 协议,以便搜索引擎能够理解它们。

为了使您的 XML 网站地图得到主要搜索引擎的支持,它必须:

  • 以开头的 <urlset> 标签开始,并以结尾的 </urlset> 标签结束。
  • <urlset> 标签内指定命名空间(协议标准)。
  • 为每个 URL 包含一个 <url> 条目,作为父 XML 标签。
  • 为每个 <url> 父标签包含一个 <loc> 子条目。

2. 按网站部分构建 XML 网站地图

我最喜欢的 XML 网站地图用例之一是在谷歌搜索控制台中按网站部分监控有效和排除的 URL。 要做到这一点,您需要为您网站的每个部分创建网站地图索引文件。以下是一个可能的示例:

Index.xml
products-index.xml
product.xml
product1.xml
blog-index.xml
blog.xml
blog-1.xml
some-directory-index.xml
directory.xml
directory-1.xml

3. 仅包括您的“盈利页面”

您应该只在 XML 网站地图文件中包含您希望 Googlebot 抓取、索引和排名的 URL。这些页面通常被称为“盈利页面”,因为它们是为您赚钱的页面。 没有理由在您的网站地图中提供对您的网站没有任何 SEO 益处的 URL。

4. 避免非 200 HTTP 状态代码

避免在您的 XML 网站地图中包含返回非 200 HTTP 响应代码的 URL。包含非 200 响应对您的 SEO 不利,因为您告诉 Googlebot 您希望抓取这些 URL,尽管它们浪费了您的抓取预算。

5. 避免未索引的 URL

标记为 noindex 的 URL 在您的 XML 网站地图中没有位置(特定用例除外)。未索引的 URL 不会从搜索引擎为您带来流量,因此在从索引中删除后,没有理由让 Googlebot 抓取它们。 注意:如果您希望谷歌快速看到大量 URL 上的 noindex 标签,可以使用临时 XML 网站地图。

6. 避免规范到其他 URL 的 URL

规范到其他 URL 的 URL 在您的 XML 网站地图中也没有位置。就像 noindex 一样,您不希望这些 URL 在谷歌上排名,因此没有理由告诉 Googlebot 抓取它们。

结论

XML 网站地图是您技术 SEO 策略的重要组成部分,因此您应该花时间对其进行优化。本指南为您提供了 6 个您可以立即实施的可行技巧。