跳转到主要内容

Rank::Ahrefs - Ahrefs Backlink Checker 爬虫工具

爬虫工具概览

爬虫工具概览

Ahrefs 爬虫工具是 SEO 专家最常用的工具之一,用于研究反向链接、评估流量、分析竞争对手的搜索查询。通过它,您可以获取有关域名评分、反向链接数量和引用域数量的完整信息。使用 Ahrefs 爬虫工具,您可以执行大规模的多线程竞争对手分析。

由于内置了强大的 Template Toolkit 模板引擎,您可以根据需要以任何形式和结构保存结果,这允许对结果应用额外的逻辑并以各种格式输出数据,包括 JSON、SQL 和 CSV

采集数据

数据采集自页面 https://ahrefs.com/ru/backlink-checker

工作时需要连接验证码识别服务 Util::TurnstileUtil::Turnstile

  • 域名评分 (DR) 和 URL 评分 (UR)
  • 反向链接数量和 dofollow 反向链接百分比
  • 引用域数量及其中 dofollow 的百分比
  • 前 100 条反向链接列表
    • 页面链接
    • 页面标题
    • DR
    • Url
    • 链接锚点
    • 重定向代码
    • 包含重定向数据的 JSON 对象数组
采集数据

应用场景

  • 获取域名汇总信息
  • 评估反向链接数量
  • 域名评估

查询

查询时需要指定域名列表,例如:

a-parser.com
yandex.ru
google.com
vk.com
facebook.com
youtube.com

结果输出示例

得益于内置的 Template Toolkit 模板引擎,A-Parser 支持灵活的结果格式化,允许以任意形式以及结构化形式(如 CSV 或 JSON)输出结果。

默认输出

结果格式:

$query: $rating\n

结果将显示域名及其评分:

a-parser.com: 39
yandex.ru: 94
vk.com: 95
facebook.com: 100
youtube.com: 99
google.com: 98

输出域名主要数据

结果格式:

$query, $url_rating $rating, $bl, $bl_dofollow, $domains, $domains_dofollow

结果示例:

a-parser.com, 21, 35, 218702, 96, 569, 53

结果格式:

[% FOREACH backlink IN backlinks;
tools.CSVline(backlink.page,backlink.title,backlink.dr,backlink.url,backlink.anchor,backlink.redirect_code);
END %]

结果示例:

https://in-scale.ru/blog/rassylka-telegram/,"Telegram 群发 - 如何进行大规模操作 + 9 款最佳程序",54,https://a-parser.com/?ref=21341,A-Parser,0
https://coba.tools/seo/monitoring-pozitsiy,"用于在搜索中检查网站排名的在线服务和程序",31,https://a-parser.com/,"访问网站",0
https://pricecontrol.biz/9-prepyatstvij-pri-parsinge-sajtov/,"Price Control 提供的 2023 年竞争对手价格数据抓取",16,https://a-parser.com/,https://a-parser.com/,0
https://www.unisender.com/ru/blog/idei/parsery-dlya-sbora-dannyh-s-sajtov/,"如何快速从网站收集数据",76,https://a-parser.com/,A-Parser,0
https://www.ashmanov.com/education/articles/poiskovye-podskazki-yandeks/,"通过 Yandex 搜索建议进行网站推广",68,https://a-parser.com/parsers/,A-parser,0
https://www.calltouch.ru/blog/luchshie-servisy-i-boty-dlya-parsinga-telegram/,"Telegram 频道爬虫工具:用于收集和处理群聊、帖子及用户数据的最佳服务和机器人综述 | Calltouch.博客",72,https://a-parser.com/parsers/,A-Parser,0
https://seonomad.net/ru/seotools/tekst-ru,"Text Ru。描述、评价、类似产品",24,https://a-parser.com/?ref=29414,A-parser,0
提示

结果格式 中使用 Template Toolkit 模板引擎FOREACH 循环中输出 $backlinks 数组元素。

将结果转储为 JSON

通用结果格式:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.items = [];

FOREACH item IN p1.backlinks;
obj.items.push({
dr = item.dr
page = item.page
title = item.title
});
END;

obj.json %]

起始文本:

[

结束文本:

]

结果示例:

[{
"items": [
{
"page": "https://forum.compucoin.org/showthread.php?tid=612923&pid=1137290",
"dr": 34,
"title": "GypeKetarert wsvpz"
},
{
"page": "https://forum.compucoin.org/showthread.php?tid=612923&pid=1137290",
"dr": 34,
"title": "GypeKetarert wsvpz"
},
{
"page": "https://forum.compucoin.org/showthread.php?tid=612923&pid=1137290",
"dr": 34,
"title": "GypeKetarert wsvpz"
},
{
"page": "https://forum.compucoin.org/showthread.php?tid=612923&pid=1137290",
"dr": 34,
"title": "GypeKetarert wsvpz"
}
]
}]
提示

要在 任务编辑器 中使用“Prepend text”和“Append text”选项,需要激活“More options”。

可选设置

参数默认值描述
Util::Turnstile presetdefault选择用于绕过验证码的 Util::TurnstileUtil::Turnstile 预设。需要预先配置 Util::TurnstileUtil::Turnstile 爬虫工具 - 指定您的访问密钥和其他参数,然后在此处选择创建的预设。
Turnstile pass proxy将代理传递给验证码识别服务。详情
Do not search for sitekey实验性选项,禁用验证码 sitekey 搜索,从而加快任务启动速度。如果出现 sitekey 无效等问题,应禁用此选项。
Mode*.domain/*选择域名类型,共有 URL 和 *.domain/* 两种。URL 为精确地址,*.domain/* 为域名及其所有子域名
Additional headers能够指定自定义请求头