Ga naar de hoofdinhoud

SE::Google::Position - Websiteposities controleren op trefwoorden in Google

Overzicht van de scraper

Scraper voor het controleren van websiteposities op trefwoorden in Google. Dankzij de scraper SE::Google::Position kunt u automatisch posities in de Google-zoekresultaten controleren met uw eigen domeindatabases. Met de scraper SE::Google::Position is het eenvoudig, nauwkeurig en snel om de positie van een website in Google te bepalen.

De functionaliteit van A-Parser stelt u in staat om instellingen van de scraper SE::Google::Position op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer. U kunt automatische substitutie van subquery's uit bestanden gebruiken.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Toepassingen van de scraper

Verzamelde gegevens

  • Websitepositie en de link naar de websitepagina
  • Lijst van alle websiteposities en links naar pagina's
Verzamelde gegevens

Mogelijkheden

  • Alle mogelijkheden van de scraper SE::GoogleSE::Google
  • Stopt automatisch de gegevensextractie wanneer de website is gevonden
  • Ondersteunt zoeken naar subdomeinen
  • Mogelijkheid om de gezochte positie te vergelijken op domein, op hoofddomein en op volledige link
  • Verzamelen van posities voor meerdere domeinen tegelijk

Gebruiksscenario's

  • Controleren van posities van eigen websites en die van concurrenten
  • Zoeken naar verkeersgenererende pagina's van een website

Query's

Als query's moet u het domein van de gezochte website en de zoekopdracht gescheiden door een spatie opgeven, bijvoorbeeld:

lenta.ru nieuws   
lenta.ru nieuws online

Als u één website wilt controleren op een lijst met query's, kunt u het domein opgeven in het query-formaat (Query format):

lenta.ru $query

Of gebruik gewoon een lijst met trefwoorden. Om meerdere domeinen tegelijk in een query te gebruiken, moet u een lijst met domeinen gescheiden door komma's opgeven en na een spatie het trefwoord, bijvoorbeeld:

lenta.ru,ria.ru,notfound.com nieuws feed

De resultaten worden opgeslagen in de array $bulkcheck. De optie Stop when found wordt ook ondersteund; de gegevensextractie eindigt als voor alle domeinen posities zijn gevonden.

Query-substituties

U kunt ingebouwde macro's gebruiken voor automatische substitutie van subquery's uit bestanden. Stel dat we websites/een website willen controleren tegen een database met zoekwoorden, dan geven we enkele basisquery's op:

ria.ru
lenta.ru
rbc.ru
yandex.ru

In het query-formaat geven we de macro op voor de substitutie van extra woorden uit het bestand Keywords.txt. Deze methode maakt het mogelijk om een database met websites te controleren tegen een database met zoekwoorden en als resultaat de posities te verkrijgen:

$query {subs:Keywords}

Deze macro zal voor elke oorspronkelijke zoekopdracht evenveel extra query's aanmaken als er in het bestand staan, wat in totaal resulteert in [aantal oorspronkelijke query's (domeinen)] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.

Opties voor resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm kunnen worden uitgevoerd, evenals in gestructureerde vormen zoals CSV of JSON.

Export van de positielijst

Resultaat verkrijgen in de vorm:

gezocht domein - zoekwoord: positienummer in de zoekresultaten

Resultaatformaat:

$domain - $key: $position\n

Voorbeeld van resultaat:

lenta.ru - nieuws: 6
lenta.ru - nieuws online: 7
...

Gelijktijdige controle van meerdere domeinen (batchcontrole)

Informatie over alle domeinen bij een gelijktijdige controle van meerdere domeinen bevindt zich in de array $bulkcheck.

Resultaatformaat:

$bulkcheck.format('$domain - $position\n')

Voorbeeld van query:

lenta.ru,ria.ru,notfound.com nieuws feed

Voorbeeld van resultaat:

lenta.ru - 1
ria.ru - 3
notfound.com - 0

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Concurrentie van trefwoorden

Hetzelfde als in SE::Google.

Indexeringscontrole van links

Hetzelfde als in SE::Google.

Opslaan in SQL-formaat

Hetzelfde als in SE::Google.

Dump van resultaten in JSON

Hetzelfde als in SE::Google.

Verwerking van resultaten

A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In deze sectie hebben we de meest populaire scenario's voor de scraper SE::Google::Position verzameld.

Domeinen opslaan zonder nulposities

Als basis is het voorbeeld van de gelijktijdige controle van meerdere domeinen genomen (zie hierboven bij de uitvoeropties) en is er een filter toegevoegd.

Voeg een filter toe en kies in de vervolgkeuzelijst de variabele voor de positie-uitvoer. Kies type: >. Voer vervolgens bij Number (Getal) 0 in. Met dit filter kunt u alle resultaten met een nulpositie verwijderen.

Voorbeeld downloaden

Hoe een voorbeeld te importeren in A-Parser

eJx1VNtu2zAM/RVDCNAVyIJ2a4HBDwPSYhk2ZE3Wy1OaB9WiUy2y6Ely2szwv4+S
ZTvtuhdZJA/Jw4tcM8ft1i4NWHCWpaualeHOUnbzJU2/Im4UpOkSrXQSdfI+ueE7
SAQWXGqbPEn3iJVLePIHDCZlhLExK7mxYHzI1ZuRCCIg55VybFwzty+BUuIOjJEC
yCgFyTmagjsiFGBsx1XlYaOHSm2zR8i2kxbx7mjUMiJ+o47E/b0+OmbN/6NXFkqD
z/shcs6VhQOPXCoHhuyRQrpifWpfY1fLehyht63f5wOyJ3THMsBSZkFb1qzXXUQ7
C/x9TeXpJLa+N/pW32LLAwb1jKQrXoROCO7AW7tGHE/cs4/AhQjUuGoz+EEMWe+0
/B3IaSQsXY0EOzNYkMpBCOCV+47dio2C7Autgu/P1ie2bMwsUZ1xIiJeWyS1hTs0
i9AD0tcM9VSpOexADbAQ/6KSStDWTHNy+hYd34Ys/onR9OUdpqKZPxni0EcJ0sXi
x+AlcI4bqlw8UN1KFtKRbC+x0i7ObwtQ9j278j0r0ECfJkaO2ekxlaD9gg0jm5aD
6kUZL8byUpmhzuVmEZe2Q1b6ll7sQl9iUSrwdelKqbFf5uthPaY2jsELA8HXzpch
hS+9e4rMISr7/aalWhpJ63fuCRbUycOsMWTGlbq7nh9a2LBSJCjQjk9MNTYyfDS6
nDorJhkWyX11cvZRhBPC+WG4n52Gs9V8aqEP4Twf3KLZzyijl7BB2lHqU7Puf0D9
r61++zeU1g2twC+7bOG+Xx5MOmq8DYjT5i+HCcki
tip

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Domeinen extraheren

Hetzelfde als in SE::Google.

Tags verwijderen uit ankers en snippets

Hetzelfde als in SE::Google.

Hetzelfde als in SE::Google.

Mogelijke instellingen

Ondersteunt alle instellingen van de scraper SE::GoogleSE::Google, evenals extra:

Naam parameterStandaardwaardeBeschrijving
Pages count1Aantal pagina's om te scrapen (van 1 tot 10)
Result format$domain - $key: $position\nStandaardformaat voor resultaatuitvoer
Stop when foundStoppen met scrapen als het domein is gevonden, gaat niet door naar de volgende pagina's
Match typeExact domainMogelijkheid om de gezochte positie te vergelijken op domein, op hoofddomein en op volledige link (Exact domain / Top level domain / Exact url)