Ga naar de hoofdinhoud

SE::Google::TrustCheck - Website trust check

Overzicht van de scraper

De scraper maakt het mogelijk om de trust van een website in Google te controleren. Alle mogelijkheden van de scraper SE::GoogleSE::Google zijn beschikbaar. Dankzij de multithreading-werking van A-Parser kan de snelheid van de verwerking van aanvragen oplopen tot 900 aanvragen per minuut, wat gemiddeld toestaat om tot 6200 resultaten per minuut te ontvangen.

Overzicht van de scraper: werksnelheid

De functionaliteit van A-Parser maakt het mogelijk om instellingen voor gegevensextractie op te slaan voor later gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit die het mogelijk maakt om extra logica op de resultaten toe te passen en gegevens in verschillende formaten uit te voeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • Controle op Trust (vertrouwen) van Google voor de site
  • Mogelijke resultaten - 0, 1 en 2:
    • 0 - geen extra linkblokken
    • 1 of 2 betekent dat Google vertrouwen heeft in de site, aangezien er extra linkblokken worden weergegeven. 1 - betekent dat de site een horizontaal linkblok heeft, en 2 - betekent dat deze een groot verticaal linkblok heeft

welke gegevens verzamelt de scraper SE::Google::TrustCheck welke gegevens verzamelt de scraper SE::Google::TrustCheck

Mogelijkheden

  • Verzamelen van een database met trust-sites
  • Ondersteunt selectie van zoekland, domein, taal van de resultaten en andere instellingen

Zoekopdrachten

Als zoekopdrachten moeten URL's van de gezochte site worden opgegeven, bijvoorbeeld:

http://uraldekor.ru/  
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://vk.com/
http://facebook.com/
http://youtube.com/

Query-substituties

U kunt ingebouwde macro's gebruiken voor automatische substitutie van subquery's uit bestanden, bijvoorbeeld als we sites willen controleren op basis van een database met zoekwoorden, geven we enkele basisquery's op:

ria.ru
lenta.ru
rbc.ru
yandex.ru

In het queryformaat geven we de macro op voor de substitutie van extra woorden uit het bestand Keywords.txt. Deze methode maakt het mogelijk om een database van sites te controleren tegen een database van zoekwoorden en als resultaat posities te verkrijgen:

$query {subs:Keywords}

Deze macro zal evenveel extra zoekopdrachten aanmaken als er in het bestand staan voor elke oorspronkelijke zoekopdracht, wat in totaal resulteert in [aantal oorspronkelijke zoekopdrachten(domeinen)] x [aantal zoekopdrachten in het bestand Keywords] = [totaal aantal zoekopdrachten] als resultaat van de macro-werking.

Ook kan in het queryformaat het protocol worden opgegeven, zodat alleen domeinen als zoekopdracht kunnen worden gebruikt:

http://$query 

Dit formaat voegt aan elke zoekopdracht http:// toe.

Opties voor resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden uitgevoerd, evenals in gestructureerde vormen zoals CSV of JSON

Export van de trust-controlelijst

Resultaatformaat:

$query: $trustrank\n

Het resultaat toont een lijst met links en de bijbehorende Trust-controle.

Voorbeeld resultaat:

http://www.yandex.ru/: 2
http://a-parser.com/: 1
http://vk.com/: 2
http://uraldekor.ru/: 0
http://google.com/: 2
...

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Concurrentie van zoekwoorden

Hetzelfde als in SE::Google.

Controle van link-indexering

Hetzelfde als in SE::Google.

Opslaan in SQL-formaat

Hetzelfde als in SE::Google.

Dump resultaten naar JSON

Hetzelfde als in SE::Google.

Verwerking van resultaten

A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In deze sectie hebben we de meest populaire cases voor de scraper SE::Google::TrustCheck verzameld

Domeinen opslaan met een trust-waarde van "1"

Voeg een filter toe en kies in de vervolgkeuzelijst de trust-variabele $trustrank - Trust rank. Kies type: String equal. Vervolgens moet in String de trust-waarde worden ingevuld die we nodig hebben: 1. Met dit filter kunt u alle resultaten met een ongewenste trust verwijderen.

Voorbeeld van filtering
Voorbeeld downloaden

Hoe een voorbeeld te importeren in A-Parser

eJx1VEtz2jAQ/iuMJod2hjhw6MU3woROOzSkCTkBB4HXRLWsNXrwGA//vSvZ2CYt
J3tf37f7raSSWW4y86LBgDUsXpSsCP8sZm9PcfwdcSshjufaGTv+gE3Wu+8FQ3OV
9VIhLWjWZwXXBrQHWNyoo6QEUu6kZf2S2VMBRIF70FokQEGRkJ2izrmlBkIa23Pp
fNrdzoE+xb07e2FeLhU738YpNB5PGqwWYDo4w8Fg0C1r2q8ZY9YQkLOKzqtU2Dku
u1D0j4UVqMgwoAw7r1YXIDMJc/jOi2FUC9oE3/ge5ljRQ+uekPXM8zBvwi34aFQJ
8uVrZI8egSeJ8JxcVgxe8Jb1XYldaE4h5XrNaPyJxtwPBgEgCHnpbsE+rC3ih4dK
X0ZILkD8rkpZnHJpoM8MdTzh1E/yOSJIIW5Rz4IU5C8ZqpGUU9iDbNMC/qMTMqFD
Mkqp6Edd+P+U2T8Y52bKLhWt/aCphwYlWI+zX21VglPckgDJmsaXIheWbDNGp/x+
BuTMAIpGumcvXY4aGpoauWanm1KA8mes3dyoaF1XY1xt59q5QZWK7aw+t5dMp+Z0
HWdqjHkhwc+lnJS0FgOv7SkZmXoN3mgb/Fw8DhR+9Mu9YxZRmp9vVauFFnQKv/kG
c1Kyy1pDbriU76/TboS1J4sMpznNlKGOtFsqfl89A9EG86U6HA7RiasEjiG4DS9C
Fdpn1TflG1gj1tYJnXXrkMI8t4Ut0qkkZc6r5oVpXqry1jsTl2da+x/zUhV4jXw6
+UhsEy7s8PwXfU7A2Q==
tip

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Domeinen extraheren

Hetzelfde als in SE::Google.

Tags verwijderen uit ankers en snippets

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Mogelijke instellingen

Ondersteunt alle instellingen van de scraper SE::GoogleSE::Google, evenals aanvullend:

Naam parameterStandaardwaardeBeschrijving
Pages count1Aantal pagina's voor het scrapen van zoekresultaten (van 1 tot 10)