SE::Yandex::Position - Kiểm tra thứ hạng website theo từ khóa trên Yandex
Tổng quan về công cụ cào dữ liệu
Công cụ cào dữ liệu kiểm tra thứ hạng website theo từ khóa trên Yandex. Nhờ công cụ cào dữ liệu SE::Yandex::Position, bạn có thể tự động kiểm tra thứ hạng trong kết quả tìm kiếm Yandex bằng cách sử dụng cơ sở dữ liệu tên miền của riêng mình. Sử dụng công cụ cào dữ liệu SE::Yandex::Position giúp xác định vị trí của trang web trên Yandex một cách dễ dàng, chính xác và nhanh chóng. Việc kiểm tra thứ hạng trên Yandex được thực hiện ở chế độ đa luồng, có khả năng sử dụng các dịch vụ giải mã captcha (AntiCaptcha hoặc bất kỳ dịch vụ nào khác hỗ trợ API của họ). Công cụ cào dữ liệu vị trí Yandex luôn hợp thời vì nó được cập nhật thường xuyên bởi các chuyên gia của chúng tôi.
Chức năng của A-Parser cho phép lưu các cài đặt cào dữ liệu của công cụ SE::Yandex::Position để sử dụng sau này (mẫu thiết lập sẵn), đặt lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động thay thế các truy vấn phụ từ tệp.
Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Các trường hợp ứng dụng công cụ cào dữ liệu
🔗 Tổng quan về các tùy chọn hiển thị
Bài viết xem xét 4 tùy chọn hiển thị kết quả khác nhau: văn bản, CSV, JSON, HTML
🔗 ⏩Thứ hạng cho nhiều khu vực
Lấy thứ hạng của trang web đồng thời cho nhiều khu vực
Dữ liệu thu thập được
- Thứ hạng trang web và liên kết đến trang web
- Danh sách tất cả các thứ hạng của trang web và liên kết đến các trang


Tính năng
- Tất cả các tính năng của công cụ cào dữ liệu
SE::Yandex - Tự động dừng cào dữ liệu khi tìm thấy trang web
- Hỗ trợ tìm kiếm tên miền phụ
- Khả năng so sánh thứ hạng cần tìm theo tên miền, theo tên miền chính và theo liên kết đầy đủ
- Thu thập thứ hạng cùng lúc cho nhiều tên miền
Các trường hợp sử dụng
- Kiểm tra thứ hạng trang web của mình và của đối thủ cạnh tranh
- Tìm kiếm các trang có lưu lượng truy cập của website
Truy vấn
Trong các truy vấn, bạn cần chỉ định tên miền của trang web cần tìm và từ khóa tìm kiếm cách nhau bởi dấu cách, ví dụ:
lenta.ru tin tức
lenta.ru tin tức trực tuyến
Nếu cần kiểm tra một trang web theo danh sách truy vấn, bạn có thể chỉ định tên miền trong định dạng truy vấn (Query format):
lenta.ru $query
Hoặc chỉ cần sử dụng danh sách các từ khóa. Để sử dụng nhiều tên miền cùng lúc trong truy vấn, bạn cần liệt kê danh sách tên miền cách nhau bởi dấu phẩy và sau đó là từ khóa cách nhau bởi dấu cách, ví dụ:
lenta.ru,ria.ru,notfound.com tin tức lenta
Kết quả sẽ được ghi vào mảng $bulkcheck.
Tùy chọn Stop when found cũng được hỗ trợ, việc cào dữ liệu sẽ kết thúc nếu tìm thấy vị trí cho tất cả các tên miền.
Thay thế truy vấn
Bạn có thể sử dụng các macro tích hợp sẵn để tự động thay thế các truy vấn phụ từ tệp, ví dụ chúng ta muốn kiểm tra các trang web/trang web theo cơ sở dữ liệu từ khóa, hãy chỉ định một số truy vấn chính:
ria.ru
lenta.ru
rbc.ru
yandex.ru
Trong định dạng truy vấn, chúng ta chỉ định macro thay thế các từ bổ sung từ tệp Keywords.txt, phương pháp này cho phép kiểm tra cơ sở dữ liệu trang web theo cơ sở dữ liệu từ khóa và nhận được kết quả là các vị trí:
$query {subs:Keywords}
Macro này sẽ tạo ra số lượng truy vấn bổ sung tương ứng với số lượng có trong tệp cho mỗi truy vấn tìm kiếm gốc, tổng cộng sẽ là [số lượng truy vấn gốc (tên miền)] x [số lượng truy vấn trong tệp Keywords] = [tổng số lượng truy vấn] sau khi macro hoạt động.
Các tùy chọn xuất kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả dưới dạng tùy ý, cũng như dạng cấu trúc như CSV hoặc JSON
Xuất danh sách thứ hạng
Nhận kết quả dưới dạng:
tên miền cần tìm - từ khóa: số thứ hạng trong kết quả tìm kiếm
Định dạng kết quả:
$domain - $key: $position\n
Ví dụ kết quả:
lenta.ru - tin tức: 3
lenta.ru - tin tức trực tuyến: 13
...
Kiểm tra đồng thời nhiều tên miền (kiểm tra hàng loạt)
Thông tin về tất cả các tên miền khi kiểm tra đồng thời nhiều tên miền được chứa trong mảng $bulkcheck.
Định dạng kết quả:
$bulkcheck.format('$domain - $position\n')
Ví dụ truy vấn:
lenta.ru,ria.ru,notfound.com tin tức lenta
Ví dụ kết quả:
lenta.ru - 1
ria.ru - 4
notfound.com - 0
Liên kết + neo + đoạn trích kèm theo vị trí
Tương tự như trong SE::Yandex.
Xuất liên kết, neo và đoạn trích vào bảng CSV
Tương tự như trong SE::Yandex.
Lưu các từ khóa liên quan
Tương tự như trong SE::Yandex.
Độ cạnh tranh của từ khóa
Tương tự như trong SE::Yandex.
Kiểm tra lập chỉ mục liên kết
Tương tự như trong SE::Yandex.
Lưu ở định dạng SQL
Tương tự như trong SE::Yandex.
Kết xuất kết quả sang JSON
Tương tự như trong SE::Yandex.
Xử lý kết quả
A-Parser cho phép xử lý kết quả trực tiếp trong quá trình cào dữ liệu, trong phần này chúng tôi đưa ra các trường hợp phổ biến nhất cho công cụ cào dữ liệu SE::Yandex::Position
Lưu các tên miền không có vị trí bằng không
Ví dụ về việc kiểm tra đồng thời nhiều tên miền (xem ở trên trong các tùy chọn xuất kết quả) đã được lấy làm cơ sở và thêm bộ lọc.
Thêm bộ lọc và trong danh sách thả xuống chọn biến xuất vị trí. Chọn loại: >. Tiếp theo, trong phần Number (Số), hãy nhập 0. Với bộ lọc này, bạn có thể loại bỏ tất cả các kết quả có vị trí bằng không.
Tải xuống ví dụ
eJx1VE1v2zAM/SuGEKAr4AXJ1gKDDwPSYAE2dE3Xj8OQ5KBGdKtFFj1JTpsF/u+j
ZNlOuu4im9Qj+fhEac8ctxt7bcCCsyxb7FkZ/lnGbr9k2U+uBbxk2TVa6STq5H1y
y7eQCCy41DZ5lu4JK5fw5A8YTMoIYykrubFgfMrFm5kIIiDnlXIs3TO3K4FK4haM
kQJoUwqyczQFd0QowNiWq8rDBg+V2qyfYL0ZNoh3J4OGEfEbtCSWS31yyur/Z68s
lAZfdn3mnCsLBxG5VA4M7UcK2YJ1pX2PbS+rNELvmrjPB2RH9I9lgGXMgrasXq3a
jHYW+PueyvEwSt9teqnvsOEBvXtG1hUvghKCO/C7rRCnQ/fiM3AhAjWumgr+IPqq
91r+DuQ0EpZ+jQQ7M1iQy0FI4J27lt2CDYLtG61C7I8mJkqWMktUZ5yIiNc7kmTh
Ds08aED+PUM9UeoStqB6WMh/UUklaGomOQV9jYFvQ+b/5Ki79g5L0Zk/G+LQZQnW
xfx7HyXwEh+pc/FAfStZSEe2nWKlXTy/DUDZaXblNSvQQFcmZo7V6TKVoP2A9Uc2
KXvXURtHx3LsXKPO5eM8Dm2LrPQd3di5nmJRKvB96Uqp1A/zTT8eExuPwRs9wdfB
01DCt95eReYQlf1221AtjaTxO/cEC1LysGpMueZK3d9cHu6wfqTIUKAdH5oqNTJ8
NLqclBXDNRbJshqdfRRhhbB+6P/PxmFtPJ8a6ENYz/uwuD1a+vdkTXfhEWlKSal6
1T1B3eO2f/shyvY1DcEve93AvWIeTD6S3gbEuP4LmbnKEA==
Xem thêm: Bộ lọc kết quả
Khử trùng lặp liên kết
Tương tự như trong SE::Yandex.
Khử trùng lặp liên kết theo tên miền
Tương tự như trong SE::Yandex.
Trích xuất tên miền
Tương tự như trong SE::Yandex.
Loại bỏ thẻ khỏi neo và đoạn trích
Tương tự như trong SE::Yandex.
Lọc liên kết theo sự hiện diện
Tương tự như trong SE::Yandex.
Các cài đặt có thể
Hỗ trợ tất cả các cài đặt của công cụ cào dữ liệu
SE::Yandex, cũng như bổ sung:
| Tên tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Pages count | 1 | Số trang cào kết quả tìm kiếm (từ 1 đến 25) |
| Links per page | 20 | Số lượng liên kết trong kết quả trên mỗi trang (10 / 20 / 30 / 50) |
| Result format | $domain - $key: $position\n | Định dạng xuất kết quả mặc định |
| Stop when found | ☑ | Dừng cào dữ liệu nếu tìm thấy tên miền, sẽ không chuyển sang các trang tiếp theo |
| Match type | Exact domain | Khả năng so sánh vị trí cần tìm theo tên miền, theo tên miền chính và theo liên kết đầy đủ (Exact domain / Top level domain / Exact url) |