SE::Google::Compromised - Controleren op de melding 'This site may be hacked' in Google
Overzicht van de scraper
De scraper Google Compromised maakt het mogelijk om te controleren op de aanwezigheid van de melding This site may be hacked in de zoekresultaten van Google. Met behulp van de scraper Google Compromised kunt u uw eigen domeinlijsten controleren op de aanwezigheid van deze melding. Meer informatie over deze melding is te vinden in de Google Search Help.
De functionaliteit van A-Parser maakt het mogelijk om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
- Controle op de aanwezigheid van de melding This site may be hacked in Google

Mogelijkheden
- Ondersteunt alle functies van de scraper
SE::Google.
Toepassingen
- Controle van een lijst met domeinen op de aanwezigheid van de melding This site may be hacked in Google
- Monitoring van eigen domeinen
Query's
Als query's moeten de URL's van de gezochte sites worden opgegeven, bijvoorbeeld:
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/
Query-substituties
U kunt ingebouwde macro's gebruiken voor de automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld sites willen controleren aan de hand van een database met zoekwoorden, geven we enkele basisquery's op:
ria.ru
lenta.ru
rbc.ru
yandex.ru
In het queryformaat geven we de macro op voor de substitutie van extra woorden uit het bestand Keywords.txt. Deze methode maakt het mogelijk om een lijst met sites te controleren op basis van een lijst met zoekwoorden en als resultaat de posities te verkrijgen:
$query {subs:Keywords}
Deze macro zal voor elke oorspronkelijke zoekopdracht evenveel extra query's aanmaken als er in het bestand staan, wat in totaal resulteert in [aantal oorspronkelijke query's (domeinen)] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.
U kunt ook het protocol opgeven in het queryformaat, zodat u alleen domeinen als query's kunt gebruiken:
http://$query
Dit formaat voegt http:// toe aan elke query.
Voorbeelden van resultaatuitvoer
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd, zoals CSV of JSON, kunnen worden uitgevoerd.
Export van de controlelijst voor de melding
Resultaatformaat:
$query: $compromised\n
Voorbeeld van een resultaat waarin de URL en de aanwezigheid van de melding This site may be hacked in Google worden weergegeven:
http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0
Links + ankers + snippets met positieweergave
Uitvoer van links, ankers en snippets naar een CSV-tabel
Opslaan van gerelateerde zoekwoorden
Zoekwoordconcurrentie
Indexeringscontrole van links
Opslaan in SQL-formaat
Resultaten dumpen naar JSON
Resultaatverwerking
A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In deze sectie hebben we de meest populaire use cases voor de scraper SE::Google::Compromised opgenomen.
Domeinen opslaan met controlewaarde "1"
Voeg een filter toe en selecteer in de vervolgkeuzelijst de variabele van de controlewaarde $compromised - Is site compromised. Kies het type: String equal. Vervolgens moet u in String (Regel) de waarde invullen die we nodig hebben: 1. Met dit filter kunt u alle resultaten met een ongewenste waarde verwijderen.

Voorbeeld downloaden
Hoe een voorbeeld te importeren in A-Parser
eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
Zie ook: Resultaatfilters
Link-deduplicatie
Link-deduplicatie per domein
Domeinen extraheren
Tags verwijderen uit ankers en snippets
Links filteren op basis van aanwezigheid
Mogelijke instellingen
Ondersteunt alle instellingen van de scraper
SE::Google, evenals extra:
| Naam parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Pages count | 1 | Aantal pagina's voor gegevensextractie uit de resultaten (van 1 tot 10) |