Przejdź do treści głównej

SE::Google::Compromised - Sprawdzanie obecności komunikatu This site may be hacked w Google

Przegląd Scrapera

Scraper Google Compromised pozwala sprawdzić obecność komunikatu This site may be hacked w wynikach wyszukiwania Google. Za pomocą scrapera Google Compromised możesz sprawdzać własne bazy domen pod kątem występowania tego komunikatu. Więcej szczegółów na temat tego komunikatu można znaleźć w Pomocy wyszukiwarki Google.

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania do późniejszego wykorzystania (presety), ustawiać harmonogram scrapowania i wiele więcej.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala stosować dodatkową logikę do wyników i wyprowadzać dane w różnych formatach, w tym JSON, SQL i CSV.

Zbierane dane

  • Sprawdzanie obecności komunikatu This site may be hacked w Google

jakie dane zbiera scraper SE::Google::Compromised

Funkcje

Zastosowania

  • Sprawdzanie listy domen pod kątem obecności komunikatu This site may be hacked w Google
  • Monitorowanie własnych domen

Zapytania

Jako zapytania należy podawać adres URL szukanej strony, na przykład:

http://a-parser.com/  
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/

Podstawienia w zapytaniach

Możesz użyć wbudowanych makr do automatycznego podstawiania podzapytań z plików, na przykład chcemy sprawdzić strony/stronę według bazy słów kluczowych, podajmy kilka głównych zapytań:

ria.ru
lenta.ru
rbc.ru
yandex.ru

W formacie zapytań wskażemy makro podstawiania dodatkowych słów z pliku Keywords.txt, ta metoda pozwala sprawdzać bazę stron według bazy słów kluczowych i otrzymać w rezultacie pozycje:

$query {subs:Keywords}

To makro utworzy tyle dodatkowych zapytań, ile znajduje się w pliku dla każdego wyjściowego zapytania, co w sumie da [liczba zapytań wyjściowych(domeny)] x [liczba zapytań w pliku Keywords] = [całkowita liczba zapytań] w wyniku działania makra.

Można również określić protokół w formacie zapytań, aby jako zapytań można było używać tylko domen:

http://$query 

Ten format wstawi http:// przed każdym zapytaniem.

Przykłady formatowania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w formie strukturalnej, np. CSV lub JSON

Eksport listy sprawdzenia obecności komunikatu

Format wyniku:

$query: $compromised\n

Przykład wyniku, w którym wyświetlany jest URL oraz informacja o obecności komunikatu This site may be hacked w Google:

http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Konkurencja słów kluczowych

Analogicznie jak w SE::Google.

Sprawdzanie indeksacji linków

Analogicznie jak w SE::Google.

Zapisywanie w formacie SQL

Analogicznie jak w SE::Google.

Zrzut wyników do JSON

Analogicznie jak w SE::Google.

Przetwarzanie wyników

A-Parser pozwala przetwarzać wyniki bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera SE::Google::Compromised

Zapisywanie domen z wartością sprawdzenia "1"

Dodaj filtr i z listy rozwijanej wybierz zmienną wartości sprawdzenia $compromised - Is site compromised. Wybierz typ: String equal. Następnie w polu String wpisz wartość, której potrzebujemy: 1. Dzięki takiemu filtrowi będziesz mógł usunąć wszystkie wyniki z niepożądaną wartością.

Przykład filtrowania
Pobierz przykład

Jak zaimportować przykład do A-Parser

eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
wskazówka

Zobacz również: Filtry wyników

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Wyodrębnianie domen

Analogicznie jak w SE::Google.

Usuwanie tagów z anchorów i snippetów

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Możliwe ustawienia

Obsługuje wszystkie ustawienia scrapera SE::GoogleSE::Google, a także dodatkowo:

Nazwa parametruWartość domyślnaOpis
Pages count1Liczba stron scrapowania wyników (od 1 do 10)