些最著名的爬虫程序是 Screaming Frog(迄今为止使用最多的)、Site Bulb、OnCrawl 或 Botify。随着时间的推移,一些机构(包括 IKAUE)甚至开发了我们自己的爬虫,使我们能够以更先进的方式工作。
爬虫将能够跟踪您网站上所需的所有 URL
并为您提供它们的标题、h1、响应代码、相似度百分比或传出和传入链接。学习了解这些爬虫为您提供的数据并利用它们制定策略是技术搜索引擎优化的重要组成部分。
在这篇文章中,我们将与据之一:爬行深度、深度或爬行深度(取决于它可能有一个名称或另一个名称的工具)。这些数据最初是一个简单的指标,表明您的网站如何被抓取,但实际上已成为我们日常 SEO 的基本要素之一。
什么是抓取深度?
这些数据到底是如何运作的?爬网深度是一个指标,根据爬网程序查找内容所需执行的步骤数对网站上的每个 URL 进行分类。要理解这一点,我们首先要知道爬虫是如何工作的。
想象一下,爬虫就像一个浏览器,从您网站的主页开始其旅程。从那里,它会跟踪在该页面上找到的所有链接,将它们添加到要爬网的 URL 列表中。每当爬虫跟 WhatsApp 数据 一个链接并访问一个新页面时,它都会重复这个过程:分析内容并收集所有链接以继续前进。
这个过程是按深度层次构建的:
爬网深度 0:爬网的初始页面(通常是主页)。
抓取深度 1:直接从主页链接的页面。
抓取深度 2:从抓取深度 1 链接的页面。
等等。
这就像您测量从主页到达特定
URL 所需的最少点击次数。这就是为什么 明智地选择你的托管 我们谈论“深度”;抓取深度越高,内容在网站结构中的“深度”就越深。
例如,如果用户进入主页并需要单击三次才能到达特定页面,则该页面的抓取深度将为 3。
为什么我们如此感兴趣?搜索引擎抓 tw 列表 取您网站的时间和资源有限,称为抓取预算。较深(较高爬行深度)的页面往往爬行频率较低,甚至根本不爬行。