Rank::Ahrefs::BrokenLinks - Scraper Ahrefs Broken Link Checker

Présentation du scraper
Rank::Ahrefs::BrokenLinks – ce scraper récupère le nombre et la liste (top 10) des liens entrants et sortants cassés.Les données sont collectées à partir de la page https://ahrefs.com/broken-link-checker.
Pour fonctionner, la connexion au service de résolution de reCAPTCHA
Util::Turnstile est requise.
Données collectées
- Nombre de liens entrants cassés et pourcentage de dofollow parmi eux
- Nombre de liens sortants cassés et pourcentage de dofollow parmi eux
- Top 10 des liens entrants cassés et leurs caractéristiques
- Top 10 des liens sortants cassés et leurs caractéristiques

Fonctionnalités
- Travail automatique avec des proxys
- Choix du type de requête
Cas d'utilisation
- Obtention de données sur les liens cassés
Requêtes
Vous devez spécifier des domaines comme requêtes, par exemple :
yep.com
a-parser.com
Exemples de résultats de sortie
A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet de sortir les résultats sous n'importe quelle forme, ainsi que de manière structurée, par exemple en CSV ou JSON.
Sortie du nombre de liens entrants et sortants cassés
Format du résultat :
$query: inbound - $in, outbound - $out\n
Exemple de résultat :
a-parser.com: inbound - 646, outbound - 1300
yep.com: inbound - 236, outbound - 0
Sortie de la liste des liens entrants cassés avec certains paramètres supplémentaires dans un tableau CSV
L'utilitaire intégré $tools.CSVLine permet de créer des documents tabulaires corrects, prêts à être importés dans Excel ou Google Sheets.
Format du résultat :
[% FOREACH item IN p1.inbound;
tools.CSVline(item.rank, item.rating, item.traffic, item.from, item.to);
END %]
Nom du fichier :
$datefile.format().csv
Texte initial :
Rank,Rating,Traffic,From,To
Exemple de résultat :
Rank,Rating,Traffic,From,To
50,93,28333.153498,https://blog.hubspot.com/marketing/top-search-engines,https://yep.com/about
23,6,0,http://lagrilladeariegeoise.com/spip.php?article5,http://user1481732362576.yep.com/blog/405236_General/1859660_4_Tips_for_overwatch_boosting
20,76,2.862819,https://www.abondance.com/20220607-47814-ahrefs-sort-yep-son-moteur-de-recherche-concurrent-de-google-et-bing.html,https://yep.com/settings
15,33,0,http://www.annieshomepage.com/shalloweenlinks.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
14,33,0,http://www.annieshomepage.com/halloween2.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
14,33,0,http://www.annieshomepage.com/halloweenlinks.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
13,92,0,https://sourceforge.net/p/jmdns/bugs/110/,http://northfacecoat.yep.com/
13,11,0.088871,http://alain-pire.be/WordPress/?p=27,http://gamesgratis.yep.com/blog
13,11,0.088871,http://alain-pire.be/WordPress/?p=27,http://hoteljobs.yep.com/blog/69066/104644
12,34,-1,https://earlyinvesting.com/search-engine-market-is-waiting-be-disrupted/,https://yep.com/about
14,32,0,https://s2.openssource.cc/threads/a-parser-universalnyj-mnogopotochnyj-parser-parsing-ljubyx-dannyx.136378/,https://a-parser.com/wiki/rank-semrush/
11,52,0,https://www.gofuckbiz.com/showthread.php?t=30454,http://a-parser.com/projects/a-parser/wiki
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/rank-linkpad/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/rank-semrush/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/se-bing-langdetect/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/javascript-parsers/class-methods-v2
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/parsers/google-maps
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/parsers/rank-linkpad
10,73,0,https://forum.bits.media/index.php?/profile/230848-_forbidden_/content/&type=forums_topic_post,https://a-parser.com/wiki/rank-semrush/
10,73,0,https://forum.bits.media/index.php?/topic/183422-a-parser-%D1%83%D0%BD%D0%B8%D0%B2%D0%B5%D1%80%D1%81%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%BC%D0%BD%D0%BE%D0%B3%D0%BE%D0%BF%D0%BE%D1%82%D0%BE%D1%87%D0%BD%D1%8B%D0%B9-%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80/,https://a-parser.com/wiki/rank-semrush/
Télécharger l'exemple
Comment importer l'exemple dans A-Parser
eJx9VFtvmzAU/ivIaqVWYmidtBf2RFjROmWhI8lekqjy4JB6MbZnm2wRyn/vMRBI
2mlv/s71Ozc3xFKzM48aDFhDwlVDVPsmISmgpDW3xCeKagPaqVcko2IXhtGzhtKE
4UTLHYgpEzuDdoNHQ+xBAcaQe9CaFYBKViBeWsafMoipsvkz/fDUJ/PJnvIazpIe
NxufoBLfJpG6oo7R6tpL0uw+ir94zELlPcw8dRcw8VPWovi0Fp7nWSm5CeL5D84E
3DirQCNj3+ufloltD6ymZcnyHpVaVieFvMVg97PP3vWGDCzmdA8LiSxKxmEUJ4hm
tHLcrwpqwWmDsmV8cxvkZo+mtCiYZVJQ3pXiOjmWtxTsd1u7kGiLT83AJEgHRRb+
2l54OLVhRa5aTDBE3fp+73xIWFJuwCcGqSYUiRSvNVgf9kDqVDk+KG+IFBHnU9gD
H83a+JOa8QLHHpXo9NA7/tskfRPjOJR3ngq34Y9GDkOUFk3Sb6NXIadye2oGZxWz
iE2ME3Yb8B6FOwA19GzmzCqpYUhjdQ1DclxsBcJtnttbP+vmv+gn75rsL+RajOOM
VG9PXpV4MbJLYS5FybZpv+ony1os8LRSEctKcXA1i5pzHJmBbFydyPQjcmBoyxvn
uE1xcZTtpn+dd1SVZriaHx3BCrt8nrUPmVPOl9n0XEPGdUNwABXksloL+q67d4eI
c7SwlbhuWNZxM3wGw5fR/OdLCJsjjvSXeex8XI2tEO8dIc6LhHfHF1MeluY=
Dans le Format des résultats, le moteur de gabarit Template Toolkit est utilisé pour afficher le tableau $inbound dans une boucle FOREACH.
Dans le nom du fichier de résultats, il suffit de changer l'extension du fichier en csv.
Pour que l'option "Texte initial" soit disponible dans l'Éditeur de tâches, vous devez activer "Plus d'options". Dans "Texte initial", nous inscrivons les noms des colonnes séparés par des virgules et nous laissons la deuxième ligne vide.
Paramètres possibles
| Paramètre | Valeur par défaut | Description |
|---|---|---|
| Util::Turnstile preset | default | Choix du préréglage Util::Turnstile pour contourner les captchas. Il est nécessaire de configurer préalablement le scraper Util::Turnstile - indiquer votre clé d'accès et d'autres paramètres, puis sélectionner le préréglage créé ici. |
| Turnstile pass proxy | ☐ | Transmission du proxy au service de résolution. En savoir plus. |
| Mode | *.domain/* | Choix du type de requête |
| Do not search for sitekey | ☑ | Option expérimentale, désactive la recherche de la sitekey du captcha, ce qui accélère le lancement de la tâche. En cas de problèmes tels qu'une sitekey invalide, cette option doit être désactivée. |
| Additional headers | Possibilité de spécifier des en-têtes de requête personnalisés |