Chuyển đến nội dung chính

SE::Yandex::Position - Kiểm tra thứ hạng website theo từ khóa trên Yandex

Tổng quan về công cụ cào dữ liệu

Công cụ cào dữ liệu kiểm tra thứ hạng website theo từ khóa trên Yandex. Nhờ công cụ cào dữ liệu SE::Yandex::Position, bạn có thể tự động kiểm tra thứ hạng trong kết quả tìm kiếm Yandex bằng cách sử dụng cơ sở dữ liệu tên miền của riêng mình. Sử dụng công cụ cào dữ liệu SE::Yandex::Position giúp xác định vị trí của trang web trên Yandex một cách dễ dàng, chính xác và nhanh chóng. Việc kiểm tra thứ hạng trên Yandex được thực hiện ở chế độ đa luồng, có khả năng sử dụng các dịch vụ giải mã captcha (AntiCaptcha hoặc bất kỳ dịch vụ nào khác hỗ trợ API của họ). Công cụ cào dữ liệu vị trí Yandex luôn hợp thời vì nó được cập nhật thường xuyên bởi các chuyên gia của chúng tôi.

Chức năng của A-Parser cho phép lưu các cài đặt cào dữ liệu của công cụ SE::Yandex::Position để sử dụng sau này (mẫu thiết lập sẵn), đặt lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động thay thế các truy vấn phụ từ tệp.

Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.

Các trường hợp ứng dụng công cụ cào dữ liệu

Dữ liệu thu thập được

  • Thứ hạng trang web và liên kết đến trang web
  • Danh sách tất cả các thứ hạng của trang web và liên kết đến các trang
Dữ liệu thu thập đượcVí dụ thu thập dữ liệu

Tính năng

  • Tất cả các tính năng của công cụ cào dữ liệu SE::YandexSE::Yandex
  • Tự động dừng cào dữ liệu khi tìm thấy trang web
  • Hỗ trợ tìm kiếm tên miền phụ
  • Khả năng so sánh thứ hạng cần tìm theo tên miền, theo tên miền chính và theo liên kết đầy đủ
  • Thu thập thứ hạng cùng lúc cho nhiều tên miền

Các trường hợp sử dụng

  • Kiểm tra thứ hạng trang web của mình và của đối thủ cạnh tranh
  • Tìm kiếm các trang có lưu lượng truy cập của website

Truy vấn

Trong các truy vấn, bạn cần chỉ định tên miền của trang web cần tìm và từ khóa tìm kiếm cách nhau bởi dấu cách, ví dụ:

lenta.ru tin tức   
lenta.ru tin tức trực tuyến

Nếu cần kiểm tra một trang web theo danh sách truy vấn, bạn có thể chỉ định tên miền trong định dạng truy vấn (Query format):

lenta.ru $query

Hoặc chỉ cần sử dụng danh sách các từ khóa. Để sử dụng nhiều tên miền cùng lúc trong truy vấn, bạn cần liệt kê danh sách tên miền cách nhau bởi dấu phẩy và sau đó là từ khóa cách nhau bởi dấu cách, ví dụ:

lenta.ru,ria.ru,notfound.com tin tức lenta

Kết quả sẽ được ghi vào mảng $bulkcheck. Tùy chọn Stop when found cũng được hỗ trợ, việc cào dữ liệu sẽ kết thúc nếu tìm thấy vị trí cho tất cả các tên miền.

Thay thế truy vấn

Bạn có thể sử dụng các macro tích hợp sẵn để tự động thay thế các truy vấn phụ từ tệp, ví dụ chúng ta muốn kiểm tra các trang web/trang web theo cơ sở dữ liệu từ khóa, hãy chỉ định một số truy vấn chính:

ria.ru
lenta.ru
rbc.ru
yandex.ru

Trong định dạng truy vấn, chúng ta chỉ định macro thay thế các từ bổ sung từ tệp Keywords.txt, phương pháp này cho phép kiểm tra cơ sở dữ liệu trang web theo cơ sở dữ liệu từ khóa và nhận được kết quả là các vị trí:

$query {subs:Keywords}

Macro này sẽ tạo ra số lượng truy vấn bổ sung tương ứng với số lượng có trong tệp cho mỗi truy vấn tìm kiếm gốc, tổng cộng sẽ là [số lượng truy vấn gốc (tên miền)] x [số lượng truy vấn trong tệp Keywords] = [tổng số lượng truy vấn] sau khi macro hoạt động.

Các tùy chọn xuất kết quả

A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả dưới dạng tùy ý, cũng như dạng cấu trúc như CSV hoặc JSON

Xuất danh sách thứ hạng

Nhận kết quả dưới dạng:

tên miền cần tìm - từ khóa: số thứ hạng trong kết quả tìm kiếm

Định dạng kết quả:

$domain - $key: $position\n

Ví dụ kết quả:

lenta.ru - tin tức: 3
lenta.ru - tin tức trực tuyến: 13
...

Kiểm tra đồng thời nhiều tên miền (kiểm tra hàng loạt)

Thông tin về tất cả các tên miền khi kiểm tra đồng thời nhiều tên miền được chứa trong mảng $bulkcheck.

Định dạng kết quả:

$bulkcheck.format('$domain - $position\n')

Ví dụ truy vấn:

lenta.ru,ria.ru,notfound.com tin tức lenta

Ví dụ kết quả:

lenta.ru - 1
ria.ru - 4
notfound.com - 0

Tương tự như trong SE::Yandex.

Tương tự như trong SE::Yandex.

Tương tự như trong SE::Yandex.

Độ cạnh tranh của từ khóa

Tương tự như trong SE::Yandex.

Kiểm tra lập chỉ mục liên kết

Tương tự như trong SE::Yandex.

Lưu ở định dạng SQL

Tương tự như trong SE::Yandex.

Kết xuất kết quả sang JSON

Tương tự như trong SE::Yandex.

Xử lý kết quả

A-Parser cho phép xử lý kết quả trực tiếp trong quá trình cào dữ liệu, trong phần này chúng tôi đưa ra các trường hợp phổ biến nhất cho công cụ cào dữ liệu SE::Yandex::Position

Lưu các tên miền không có vị trí bằng không

Ví dụ về việc kiểm tra đồng thời nhiều tên miền (xem ở trên trong các tùy chọn xuất kết quả) đã được lấy làm cơ sở và thêm bộ lọc.

Thêm bộ lọc và trong danh sách thả xuống chọn biến xuất vị trí. Chọn loại: >. Tiếp theo, trong phần Number (Số), hãy nhập 0. Với bộ lọc này, bạn có thể loại bỏ tất cả các kết quả có vị trí bằng không.

Tải xuống ví dụ

Cách nhập ví dụ vào A-Parser

eJx1VE1v2zAM/SuGEKAr4AXJ1gKDDwPSYAE2dE3Xj8OQ5KBGdKtFFj1JTpsF/u+j
ZNlOuu4im9Qj+fhEac8ctxt7bcCCsyxb7FkZ/lnGbr9k2U+uBbxk2TVa6STq5H1y
y7eQCCy41DZ5lu4JK5fw5A8YTMoIYykrubFgfMrFm5kIIiDnlXIs3TO3K4FK4haM
kQJoUwqyczQFd0QowNiWq8rDBg+V2qyfYL0ZNoh3J4OGEfEbtCSWS31yyur/Z68s
lAZfdn3mnCsLBxG5VA4M7UcK2YJ1pX2PbS+rNELvmrjPB2RH9I9lgGXMgrasXq3a
jHYW+PueyvEwSt9teqnvsOEBvXtG1hUvghKCO/C7rRCnQ/fiM3AhAjWumgr+IPqq
91r+DuQ0EpZ+jQQ7M1iQy0FI4J27lt2CDYLtG61C7I8mJkqWMktUZ5yIiNc7kmTh
Ds08aED+PUM9UeoStqB6WMh/UUklaGomOQV9jYFvQ+b/5Ki79g5L0Zk/G+LQZQnW
xfx7HyXwEh+pc/FAfStZSEe2nWKlXTy/DUDZaXblNSvQQFcmZo7V6TKVoP2A9Uc2
KXvXURtHx3LsXKPO5eM8Dm2LrPQd3di5nmJRKvB96Uqp1A/zTT8eExuPwRs9wdfB
01DCt95eReYQlf1221AtjaTxO/cEC1LysGpMueZK3d9cHu6wfqTIUKAdH5oqNTJ8
NLqclBXDNRbJshqdfRRhhbB+6P/PxmFtPJ8a6ENYz/uwuD1a+vdkTXfhEWlKSal6
1T1B3eO2f/shyvY1DcEve93AvWIeTD6S3gbEuP4LmbnKEA==
mẹo

Tương tự như trong SE::Yandex.

Tương tự như trong SE::Yandex.

Trích xuất tên miền

Tương tự như trong SE::Yandex.

Loại bỏ thẻ khỏi neo và đoạn trích

Tương tự như trong SE::Yandex.

Tương tự như trong SE::Yandex.

Các cài đặt có thể

Hỗ trợ tất cả các cài đặt của công cụ cào dữ liệu SE::YandexSE::Yandex, cũng như bổ sung:

Tên tham sốGiá trị mặc địnhMô tả
Pages count1Số trang cào kết quả tìm kiếm (từ 1 đến 25)
Links per page20Số lượng liên kết trong kết quả trên mỗi trang (10 / 20 / 30 / 50)
Result format$domain - $key: $position\nĐịnh dạng xuất kết quả mặc định
Stop when foundDừng cào dữ liệu nếu tìm thấy tên miền, sẽ không chuyển sang các trang tiếp theo
Match typeExact domainKhả năng so sánh vị trí cần tìm theo tên miền, theo tên miền chính và theo liên kết đầy đủ (Exact domain / Top level domain / Exact url)