您现在的位置是:首页 > 网站制作 > WordpressWordpress

通过XML网站地图验证器来排查WordPress网站错误

杰帅2023-07-07【Wordpress】人已围观

简介在这篇文章中搬主题将介绍什么是网站地图验证器以及它们是如何工作的。然后将指导你在使用网站地图验证器时可能遇到的常见错误以及如何解决这些问题。

提交XML网站地图可以向搜索引擎提供你希望他们索引的每一个网站页面的全部内容。因此,这是你的搜索引擎优化(SEO)战略中的一个重要步骤。然而,为了获得最佳效果,你需要使用网站地图验证器来确保你发送的文件没有错误。

在这篇文章中搬主题将介绍什么是网站地图验证器以及它们是如何工作的。然后将指导你在使用网站地图验证器时可能遇到的常见错误以及如何解决这些问题。

什么是网站地图验证器?

网站地图是一个文件,包含了你的网站上每一个你希望搜索引擎收录的URL的列表。网站地图有XML或HTML格式,其中前者是最受欢迎的选择。

从技术上讲,你不需要向谷歌或其他搜索引擎提交你的网站地图。这些平台使用爬虫来浏览你的网站,识别每个URL,并对这些页面进行索引。然而,创建一个网站地图可以让你完全控制哪些URL被搜索引擎索引,哪些URL不应该被索引(如私人或多余的内容)。

在大多数情况下,你会利用自动生成的网站地图。如果你使用WordPress,Yoast等SEO插件可以帮助你创建网站地图,你可以提交给谷歌搜索控制台。

网站地图验证器是一种工具,可以处理这些XML或HTML文件,并确保它们不包含错误。我们所说的 "错误 "是指。

  • 搜索引擎无法抓取的页面
  • 404错误
  • 401错误
  • 网站地图中的URL太多
  • 非经典的URL

如果你的网站地图包含这些错误,搜索引擎可能无法索引你列出的每个页面。手动读取XML文件以发现问题可能需要很长时间,而且你还需要测试URL。幸运的是,网站地图验证器使你能够跳过所有这些工作,并开始修复它们所识别的任何错误。

如何使用网站地图验证器

使用网站地图验证器很简单。根据你使用的工具,你可能需要上传一个XML文件或提供一个网站地图的URL。如果你使用XML网站地图验证器这样的工具,后一种选择可能适用。

输入你要检查的网站地图的URL,该工具将返回一份报告,包括它发现的任何错误。

如果你得到一个没有问题的报告,搜索引擎可以索引网站地图中的URL。你可以放心地将网站地图提交给Google、Bing、Yandex或任何你想要的地方。然而,如果你遇到错误,你需要知道如何修复它们。这就把我们带到了下一节。

5个常见的网站地图错误以及如何修复这些错误

不幸的是,有些网站地图的验证并不完美,但我们将介绍网站地图验证器在你提交给他们的文件中可以发现的一些最常见的错误。让我们先讨论一下有抓取 "问题 "的页面。

1. 有抓取问题的页面

抓取问题是验证器会返回的最常见的问题之一。这个错误意味着该服务无法抓取你的网站地图中的某个页面。

一般来说,当验证器或搜索引擎无法抓取一个页面时,这意味着以下情况之一。

  • 该页面的加载时间过长。如果你的网站加载时间过长,与爬虫的连接就会超时。这意味着有些页面可能无法被索引。
  • 你的网站使用了太多的重定向。当重定向设置不正确时,你的网站可能最终陷入重定向循环。这意味着搜索引擎将无法抓取它。
  • 网站阻挡了搜索引擎的抓取。你可以配置WordPress以阻止爬虫(使用noindex标签),这样你的网站就不会被索引了。通常情况下,你可能在建立网站或创建私人页面时这样做。
  • 该页面返回404或401以外的错误代码。网站地图验证器可以解析404错误。然而,其他HTTP错误代码将导致 "抓取问题 "警告。

抓取问题 "的错误可能是模糊的。然而,你可以通过访问有关的URL来确定确切的问题。如果页面加载迅速且正确,您的网站可能会阻止搜索引擎抓取。

如果页面加载没有错误,我们建议测试你的网站的加载时间,看看是否存在性能问题。否则,你应该看到特定的错误代码或多次重定向的情况。

2. 404错误

网站地图中的404错误很容易解决。如果一个页面不再存在,你可以从网站地图中手动删除该条目,或者为它设置一个重定向。对你来说,最好的选择将取决于该页面是否仍有流量。

来自Google Search Console和其他服务的网站分析将显示404页面是否仍有访客。在这种情况下,你最好的选择是设置一个重定向到最近的相关页面或文章,这样你就不会错过这些流量了。只要你使用单一的重定向,就不会导致网站地图验证错误。

3. 401错误

网站地图中的401 "未授权"错误意味着爬虫无法访问一个特定的页面,因为他们没有必要的权限。这个错误通常是在你处理一个需要用户登录的页面时出现的。解决这个错误的唯一办法是从网站地图中删除需要授权的页面。任何只有登录的用户才能看到的页面都不应该被索引。否则,在搜索引擎结果页(SERPs)中点击它的访问者会发现自己面临401错误。

 

4. 网站地图中的URL太多

搜索引擎可以抓取有数千页的大型网站。然而,根据我们的经验,如果你列出任何接近(或超过)50,000个页面,网站地图就会开始显示错误。

如果这是你的情况,那么为你的努力点个赞。50,000个页面是一个很大的数字。然而,大多数拥有超过50,000个页面的网站可能有多个来自用户生成的内容的URL。在这种情况下,你要优先考虑网站上最重要的页面,同时删除用户可能不希望在SERP中看到的网站地图条目。

5. 网站地图中的非经典URL

有时,当搜索引擎看到同一个页面有多个版本的URL时,可能会感到困惑。例如,你可能会使用以下任何一个URL来访问一个简单的博客页面。

  • http://yourwebsite.com
  • http://www.yourwebsite.com
  • https://yourwebsite.com
  • https://www.yourwebsite.com

在实践中,所有这些URL都可以指向同一个页面(如果你把HTTP流量重定向到HTTPS)。然而,搜索引擎可能会把这些URL看作是网站地图中的四个不同条目,从而导致验证错误。

解决这个问题的简单方法是,为你的WordPress网站指定一个规范的URL。像Yoast这样的SEO插件会自动为你的网站指定规范的URL。如果你使用的是由SEO插件生成的XML文件,那么在使用网站地图验证器时,你应该不会遇到 "非经典 "的错误。

这里可以下载本站的汉化中文版插件【Yoast SEO Premium完美汉化中文版|WordPress最受欢迎SEO优化插件介绍

最后总结

随着你的WordPress网站的发展,使用网站地图变得更加关键。网站地图让你告诉搜索引擎哪些页面应该被索引,哪些页面应该被忽略。此外,使用网站地图验证器将帮助你发现错误,以便爬虫在索引你的网站时不会遇到问题。

简而言之,使用网站地图验证器可能遇到的五个最常见的错误是。

  1. 有抓取问题的页面。你需要检查你的加载时间、重定向,并访问你的网站页面以确定具体问题。
  2. 404错误。这个错误意味着你应该从你的网站地图中删除不存在的页面,或者为它设置一个重定向。
  3. 401错误。考虑从你的网站地图中删除受限制的页面。
  4. 网站地图中的URL太多。你可能需要对你的网站地图中的页面进行选择,并删除不太有用的页面。
  5. 网站地图中的非规范性URL。我们建议为特定页面设置一个规范的URL。

Tags:WordPress   WordPress SEO优化教程   WordPress优化教程   WordPress教程

很赞哦! ()

文章评论

本站推荐

站点信息

  • 建站时间:2018-10-24
  • 网站程序:帝国CMS7.5
  • 主题模板《今夕何夕》
  • 文章统计1172篇文章
  • 标签管理标签云
  • 统计数据百度统计
  • 微信公众号:扫描二维码,关注我们