Rank::Ahrefs::BrokenLinks - Công cụ cào dữ liệu Ahrefs Broken Link Checker

Tổng quan về công cụ cào dữ liệu
Rank::Ahrefs::BrokenLinks – công cụ cào dữ liệu này lấy số lượng và danh sách (top 10) các liên kết ngược và liên kết ngoài bị hỏng.Dữ liệu được thu thập từ trang https://ahrefs.com/broken-link-checker.
Để hoạt động, cần kết nối dịch vụ giải reCAPTCHA
Util::Turnstile.
Dữ liệu thu thập được
- Số lượng liên kết ngược (inbound) bị hỏng và tỷ lệ dofollow trong số đó
- Số lượng liên kết ra ngoài (outbound) bị hỏng và tỷ lệ dofollow trong số đó
- Top 10 liên kết ngược bị hỏng và các đặc điểm của chúng
- Top 10 liên kết ra ngoài bị hỏng và các đặc điểm của chúng

Tính năng
- Tự động làm việc với proxy
- Lựa chọn loại truy vấn
Ứng dụng
- Lấy dữ liệu về các liên kết bị hỏng
Truy vấn
Trong các truy vấn, bạn cần chỉ định tên miền, ví dụ:
yep.com
a-parser.com
Các ví dụ về kết quả đầu ra
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở định dạng bất kỳ, cũng như các định dạng có cấu trúc như CSV hoặc JSON
Xuất số lượng liên kết hỏng inbound và outbound
Định dạng kết quả:
$query: inbound - $in, outbound - $out\n
Ví dụ kết quả:
a-parser.com: inbound - 646, outbound - 1300
yep.com: inbound - 236, outbound - 0
Xuất danh sách các liên kết ngược bị hỏng với một số tham số bổ sung vào bảng CSV
Tiện ích tích hợp $tools.CSVLine cho phép tạo các tài liệu bảng chính xác, sẵn sàng để nhập vào Excel hoặc Google Sheets.
Định dạng kết quả:
[% FOREACH item IN p1.inbound;
tools.CSVline(item.rank, item.rating, item.traffic, item.from, item.to);
END %]
Tên tệp:
$datefile.format().csv
Văn bản bắt đầu:
Rank,Rating,Traffic,From,To
Ví dụ kết quả:
Rank,Rating,Traffic,From,To
50,93,28333.153498,https://blog.hubspot.com/marketing/top-search-engines,https://yep.com/about
23,6,0,http://lagrilladeariegeoise.com/spip.php?article5,http://user1481732362576.yep.com/blog/405236_General/1859660_4_Tips_for_overwatch_boosting
20,76,2.862819,https://www.abondance.com/20220607-47814-ahrefs-sort-yep-son-moteur-de-recherche-concurrent-de-google-et-bing.html,https://yep.com/settings
15,33,0,http://www.annieshomepage.com/shalloweenlinks.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
14,33,0,http://www.annieshomepage.com/halloween2.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
14,33,0,http://www.annieshomepage.com/halloweenlinks.html,http://www.yep.com/cgi-bin/displayRank_yep.cgi?Religion/ranking/25
13,92,0,https://sourceforge.net/p/jmdns/bugs/110/,http://northfacecoat.yep.com/
13,11,0.088871,http://alain-pire.be/WordPress/?p=27,http://gamesgratis.yep.com/blog
13,11,0.088871,http://alain-pire.be/WordPress/?p=27,http://hoteljobs.yep.com/blog/69066/104644
12,34,-1,https://earlyinvesting.com/search-engine-market-is-waiting-be-disrupted/,https://yep.com/about
14,32,0,https://s2.openssource.cc/threads/a-parser-universalnyj-mnogopotochnyj-parser-parsing-ljubyx-dannyx.136378/,https://a-parser.com/wiki/rank-semrush/
11,52,0,https://www.gofuckbiz.com/showthread.php?t=30454,http://a-parser.com/projects/a-parser/wiki
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/rank-linkpad/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/rank-semrush/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-5,https://a-parser.com/wiki/se-bing-langdetect/
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/javascript-parsers/class-methods-v2
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/parsers/google-maps
11,32,0,https://s2.openssource.cc/threads/a-parser-1-1-prodvinutyj-parser-poiskovyx-sistem-suggest-pr-dmoz-whois-etc.19351/page-6,https://a-parser.com/docs/parsers/rank-linkpad
10,73,0,https://forum.bits.media/index.php?/profile/230848-_forbidden_/content/&type=forums_topic_post,https://a-parser.com/wiki/rank-semrush/
10,73,0,https://forum.bits.media/index.php?/topic/183422-a-parser-%D1%83%D0%BD%D0%B8%D0%B2%D0%B5%D1%80%D1%81%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%BC%D0%BD%D0%BE%D0%B3%D0%BE%D0%BF%D0%BE%D1%82%D0%BE%D1%87%D0%BD%D1%8B%D0%B9-%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80/,https://a-parser.com/wiki/rank-semrush/
Tải xuống ví dụ
eJx9VFtvmzAU/ivIaqVWYmidtBf2RFjROmWhI8lekqjy4JB6MbZnm2wRyn/vMRBI
2mlv/s71Ozc3xFKzM48aDFhDwlVDVPsmISmgpDW3xCeKagPaqVcko2IXhtGzhtKE
4UTLHYgpEzuDdoNHQ+xBAcaQe9CaFYBKViBeWsafMoipsvkz/fDUJ/PJnvIazpIe
NxufoBLfJpG6oo7R6tpL0uw+ir94zELlPcw8dRcw8VPWovi0Fp7nWSm5CeL5D84E
3DirQCNj3+ufloltD6ymZcnyHpVaVieFvMVg97PP3vWGDCzmdA8LiSxKxmEUJ4hm
tHLcrwpqwWmDsmV8cxvkZo+mtCiYZVJQ3pXiOjmWtxTsd1u7kGiLT83AJEgHRRb+
2l54OLVhRa5aTDBE3fp+73xIWFJuwCcGqSYUiRSvNVgf9kDqVDk+KG+IFBHnU9gD
H83a+JOa8QLHHpXo9NA7/tskfRPjOJR3ngq34Y9GDkOUFk3Sb6NXIadye2oGZxWz
iE2ME3Yb8B6FOwA19GzmzCqpYUhjdQ1DclxsBcJtnttbP+vmv+gn75rsL+RajOOM
VG9PXpV4MbJLYS5FybZpv+ony1os8LRSEctKcXA1i5pzHJmBbFydyPQjcmBoyxvn
uE1xcZTtpn+dd1SVZriaHx3BCrt8nrUPmVPOl9n0XEPGdUNwABXksloL+q67d4eI
c7SwlbhuWNZxM3wGw5fR/OdLCJsjjvSXeex8XI2tEO8dIc6LhHfHF1MeluY=
Trong Định dạng kết quả, bộ tạo mẫu Template Toolkit được sử dụng để xuất mảng $inbound trong vòng lặp FOREACH.
Trong tên tệp kết quả, bạn chỉ cần thay đổi phần mở rộng tệp thành csv.
Để tùy chọn "Prepend text" hiển thị trong Trình chỉnh sửa tác vụ, bạn cần kích hoạt "More options". Trong "Prepend text", chúng ta ghi tên các cột cách nhau bằng dấu phẩy và để dòng thứ hai trống.
Các cài đặt có thể
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Util::Turnstile preset | default | Lựa chọn cấu hình sẵn Util::Turnstile để vượt qua captcha. Cần cấu hình trước công cụ cào dữ liệu Util::Turnstile - nhập khóa truy cập của bạn và các tham số khác, sau đó chọn cấu hình đã tạo tại đây. |
| Turnstile pass proxy | ☐ | Chuyển proxy vào dịch vụ giải mã. Chi tiết. |
| Mode | *.domain/* | Lựa chọn loại truy vấn |
| Do not search for sitekey | ☑ | Tùy chọn thử nghiệm, tắt tìm kiếm sitekey của captcha, giúp tăng tốc độ khởi chạy tác vụ. Trong trường hợp gặp lỗi như sitekey không hợp lệ, nên tắt tùy chọn này. |
| Additional headers | Khả năng chỉ định các tiêu đề truy vấn tùy chỉnh |