Ga naar de hoofdinhoud

SE::Google::Compromised - Controleren op de melding 'This site may be hacked' in Google

Overzicht van de scraper

De scraper Google Compromised maakt het mogelijk om te controleren op de aanwezigheid van de melding This site may be hacked in de zoekresultaten van Google. Met behulp van de scraper Google Compromised kunt u uw eigen domeinlijsten controleren op de aanwezigheid van deze melding. Meer informatie over deze melding is te vinden in de Google Search Help.

De functionaliteit van A-Parser maakt het mogelijk om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • Controle op de aanwezigheid van de melding This site may be hacked in Google

welke gegevens verzamelt de scraper SE::Google::Compromised

Mogelijkheden

  • Ondersteunt alle functies van de scraper SE::GoogleSE::Google.

Toepassingen

  • Controle van een lijst met domeinen op de aanwezigheid van de melding This site may be hacked in Google
  • Monitoring van eigen domeinen

Query's

Als query's moeten de URL's van de gezochte sites worden opgegeven, bijvoorbeeld:

http://a-parser.com/  
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/

Query-substituties

U kunt ingebouwde macro's gebruiken voor de automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld sites willen controleren aan de hand van een database met zoekwoorden, geven we enkele basisquery's op:

ria.ru
lenta.ru
rbc.ru
yandex.ru

In het queryformaat geven we de macro op voor de substitutie van extra woorden uit het bestand Keywords.txt. Deze methode maakt het mogelijk om een lijst met sites te controleren op basis van een lijst met zoekwoorden en als resultaat de posities te verkrijgen:

$query {subs:Keywords}

Deze macro zal voor elke oorspronkelijke zoekopdracht evenveel extra query's aanmaken als er in het bestand staan, wat in totaal resulteert in [aantal oorspronkelijke query's (domeinen)] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.

U kunt ook het protocol opgeven in het queryformaat, zodat u alleen domeinen als query's kunt gebruiken:

http://$query 

Dit formaat voegt http:// toe aan elke query.

Voorbeelden van resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd, zoals CSV of JSON, kunnen worden uitgevoerd.

Export van de controlelijst voor de melding

Resultaatformaat:

$query: $compromised\n

Voorbeeld van een resultaat waarin de URL en de aanwezigheid van de melding This site may be hacked in Google worden weergegeven:

http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0

Vergelijkbaar met SE::Google.

Vergelijkbaar met SE::Google.

Vergelijkbaar met SE::Google.

Zoekwoordconcurrentie

Vergelijkbaar met SE::Google.

Indexeringscontrole van links

Vergelijkbaar met SE::Google.

Opslaan in SQL-formaat

Vergelijkbaar met SE::Google.

Resultaten dumpen naar JSON

Vergelijkbaar met SE::Google.

Resultaatverwerking

A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In deze sectie hebben we de meest populaire use cases voor de scraper SE::Google::Compromised opgenomen.

Domeinen opslaan met controlewaarde "1"

Voeg een filter toe en selecteer in de vervolgkeuzelijst de variabele van de controlewaarde $compromised - Is site compromised. Kies het type: String equal. Vervolgens moet u in String (Regel) de waarde invullen die we nodig hebben: 1. Met dit filter kunt u alle resultaten met een ongewenste waarde verwijderen.

Voorbeeld van filtering
Voorbeeld downloaden

Hoe een voorbeeld te importeren in A-Parser

eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
tip

Vergelijkbaar met SE::Google.

Vergelijkbaar met SE::Google.

Domeinen extraheren

Vergelijkbaar met SE::Google.

Tags verwijderen uit ankers en snippets

Vergelijkbaar met SE::Google.

Vergelijkbaar met SE::Google.

Mogelijke instellingen

Ondersteunt alle instellingen van de scraper SE::GoogleSE::Google, evenals extra:

Naam parameterStandaardwaardeBeschrijving
Pages count1Aantal pagina's voor gegevensextractie uit de resultaten (van 1 tot 10)