SEO Spider是一个功能强大且灵活的网站爬虫,能够有效地抓取小型和超大型网站,同时允许您实时分析结果。它收集关键的现场数据,以便SEO能够做出明智的决策尖叫青蛙 SEO蜘蛛可以让你快速抓取,分析和审计一个网站的现场搜索引擎优化。这里为大家介绍SEO Spider 查找断开的链接教程,感兴趣的朋友快来试试吧。
1) 抓取网站
打开 SEO Spider,在“输入蜘蛛网址”框中键入或复制您要抓取的网站,然后点击“开始”。
2) 单击“响应代码”选项卡和“客户端错误 (4XX)”过滤器以查看损坏的链接
您可以等到抓取完成并达到 100%,或者您可以在抓取时通过导航到“响应代码”选项卡并使用“客户端错误 4XX”过滤器来查看 404 断开的链接。
有两种方法可以做到这一点,您只需单击顶部的“选项卡”并使用下拉过滤器 –
或者,您可以使用右侧窗口抓取概览窗格,然后直接单击“响应代码”文件夹下的“客户端错误 (4xx)”树视图。无论您以哪种方式导航,它们都显示相同的结果。
此爬网概览窗格会在爬网时更新,因此您可以一目了然地看到客户端错误 4XX 链接的数量。在上面的实例中,有 9 个客户端错误,占爬网中发现的链接的 0.18%。
3)通过单击“链接”选项卡查看断开链接的来源
显然,您会想知道发现的损坏链接的来源(网站上的哪些 URL 链接到这些损坏的链接),以便修复它们。为此,只需单击顶部窗口窗格中的 URL,然后单击底部的“Inlinks”选项卡以填充下部窗口窗格。
这是下部窗口窗格的近距离视图,其中详细介绍了“inlinks”数据 -
'From' 是可以找到 404 断开链接的来源,而 'To' 是断开的链接。您还可以查看锚文本、替代文本(如果它是超链接的图像)以及链接是被跟踪 (true) 还是 nofollow (false)。看起来我们网站上唯一断开的链接是外部链接(我们链接到的站点),但显然 SEO Spider 会发现任何内部断开的链接(如果有的话)。
4) 使用“批量导出 > 响应代码 > 客户端错误 (4XX) 链接”导出
如果您更愿意在电子表格中查看数据,您可以使用顶部的“批量导出”、“响应代码”和“客户端错误 (4XX) 链接”选项导出“源”URL 和“断开的链接”级别菜单。这应该涵盖在网站上查找损坏链接的大多数情况。
但是,“源”URL 是链接到 404 错误页面的最后一页。因此,有时“源”可能是重定向(并且可能在重定向链中)。例如,您可以查看“源”是否是重定向,因为“类型”列会显示“HTTP 重定向”。
要快速找到这些错误的原始源页面,我们建议使用“报告 > 重定向 > 所有重定向”下的“所有重定向”导出。打开报告并将“最终状态代码”列过滤为“404”。'Source'是原始来源页面,'address'是最后一个来源,'final address'是404 URL。
抓取断开链接的 URL 列表
最后,如果您有一个 URL 列表,您想要检查损坏的链接而不是抓取网站,那么您可以简单地以列表模式上传它们。
要切换到“列表”模式,只需单击顶级导航中的“模式 > 列表”,然后您就可以选择粘贴 URL 或通过文件上传。
查找损坏的“跳转链接”
跳转链接是一种使用链接上的命名锚点(也称为“书签”、“命名锚点”和“跳过链接”)将用户链接到网页特定部分的有用方法。
无法以与上述相同的方式找到这些损坏的书签,因为它们不会以 404 状态代码进行响应,而且它们经常被忽视。
您需要启用位于“配置 > 蜘蛛 > 高级”中的“抓取片段标识符”,抓取网站,然后在“URL”选项卡和“损坏的书签”过滤器下查看它们。
以上便是为大家带来的全部内容。