SE::Google::Compromised - Kiểm tra sự hiện diện của thông báo This site may be hacked trên Google
Tổng quan về công cụ cào dữ liệu
Công cụ cào dữ liệu Google Compromised cho phép kiểm tra sự hiện diện của dòng chữ This site may be hacked trong kết quả tìm kiếm của Google. Với sự trợ giúp của công cụ cào dữ liệu Google Compromised, bạn có thể kiểm tra cơ sở dữ liệu tên miền của riêng mình để xem có dòng chữ này hay không. Bạn có thể tìm hiểu thêm về dòng chữ này trong Trợ giúp tìm kiếm Google.
Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác.
Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ tích hợp Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Dữ liệu thu thập được
- Kiểm tra sự hiện diện của dòng chữ This site may be hacked trên Google

Tính năng
- Hỗ trợ tất cả các tính năng của công cụ cào dữ liệu
SE::Google.
Các trường hợp sử dụng
- Kiểm tra danh sách tên miền để xem có dòng chữ This site may be hacked trên Google hay không
- Giám sát các tên miền của chính mình
Truy vấn
Trong phần truy vấn, bạn cần chỉ định URL của trang web cần tìm, ví dụ:
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/
Thay thế truy vấn
Bạn có thể sử dụng các macro tích hợp để tự động thay thế các truy vấn phụ từ tệp, ví dụ: chúng ta muốn kiểm tra các trang web theo cơ sở dữ liệu từ khóa, hãy chỉ định một vài truy vấn chính:
ria.ru
lenta.ru
rbc.ru
yandex.ru
Trong định dạng truy vấn, chúng ta chỉ định macro thay thế các từ bổ sung từ tệp Keywords.txt, phương pháp này cho phép kiểm tra cơ sở dữ liệu trang web theo cơ sở dữ liệu từ khóa và nhận được vị trí trong kết quả:
$query {subs:Keywords}
Macro này sẽ tạo ra số lượng truy vấn bổ sung tương ứng với số lượng từ có trong tệp cho mỗi truy vấn tìm kiếm ban đầu, tổng cộng sẽ cho ra [số lượng truy vấn ban đầu (tên miền)] x [số lượng truy vấn trong tệp Keywords] = [tổng số lượng truy vấn] sau khi macro hoạt động.
Bạn cũng có thể chỉ định giao thức trong định dạng truy vấn để có thể chỉ sử dụng tên miền làm truy vấn:
http://$query
Định dạng này sẽ thêm http:// vào trước mỗi truy vấn.
Các tùy chọn xuất kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả dưới dạng tùy ý cũng như có cấu trúc, ví dụ CSV hoặc JSON
Xuất danh sách kiểm tra sự hiện diện của dòng chữ
Định dạng kết quả:
$query: $compromised\n
Ví dụ kết quả hiển thị URL và sự hiện diện của dòng chữ This site may be hacked trên Google:
http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0
Liên kết + anchor + snippet với hiển thị vị trí
Tương tự như trong SE::Google.
Xuất liên kết, anchor và snippet vào bảng CSV
Tương tự như trong SE::Google.
Lưu các từ khóa liên quan
Tương tự như trong SE::Google.
Cạnh tranh từ khóa
Tương tự như trong SE::Google.
Kiểm tra lập chỉ mục liên kết
Tương tự như trong SE::Google.
Lưu dưới định dạng SQL
Tương tự như trong SE::Google.
Dump kết quả sang JSON
Tương tự như trong SE::Google.
Xử lý kết quả
A-Parser cho phép xử lý kết quả trực tiếp trong quá trình cào dữ liệu, trong phần này chúng tôi đưa ra các trường hợp phổ biến nhất cho công cụ cào dữ liệu SE::Google::Compromised
Lưu các tên miền có giá trị kiểm tra là "1"
Thêm bộ lọc và trong danh sách thả xuống chọn biến giá trị kiểm tra $compromised - Is site compromised. Chọn loại: String equal. Tiếp theo, trong mục String (Dòng), hãy nhập giá trị chúng ta cần là 1. Với bộ lọc này, bạn có thể loại bỏ tất cả các kết quả có giá trị không mong muốn.

Tải xuống ví dụ
eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
Xem thêm: Bộ lọc kết quả
Khử trùng lặp liên kết
Tương tự như trong SE::Google.
Khử trùng lặp liên kết theo tên miền
Tương tự như trong SE::Google.
Trích xuất tên miền
Tương tự như trong SE::Google.
Xóa thẻ khỏi anchor và snippet
Tương tự như trong SE::Google.
Lọc liên kết theo sự xuất hiện
Tương tự như trong SE::Google.
Các cài đặt có thể có
Hỗ trợ tất cả các cài đặt của công cụ cào dữ liệu
SE::Google, cũng như bổ sung:
| Tên tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Pages count | 1 | Số lượng trang kết quả tìm kiếm cần cào (từ 1 đến 10) |