Ga naar de hoofdinhoud

SE::DuckDuckGo::Position - Websiteposities controleren op trefwoorden in DuckDuckGo

Overzicht van de scraper

Scraper voor het controleren van websiteposities op trefwoorden in DuckDuckGo. Dankzij de scraper SE::DuckDuckGo::Position kunt u automatisch posities in de DuckDuckGo-zoekresultaten controleren met uw eigen domeindatabases. Door de scraper SE::DuckDuckGo::Position te gebruiken, is het eenvoudig, nauwkeurig en snel om de positie van een website in DuckDuckGo te bepalen.

De functionaliteit van A-Parser maakt het mogelijk om instellingen voor de SE::DuckDuckGo::Position scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer. U kunt automatische substitutie van subquery's uit bestanden gebruiken.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • De positie van de website en de link naar de webpagina
  • Een lijst van alle websiteposities en links naar pagina's
Verzamelde gegevens

Mogelijkheden

  • Alle mogelijkheden van de scraper SE::DuckDuckGoSE::DuckDuckGo
  • Stopt automatisch de gegevensextractie zodra de website is gevonden
  • Ondersteunt het zoeken naar subdomeinen
  • Mogelijkheid om de gezochte positie te vergelijken op domein, op hoofddomein en op volledige link
  • Verzamelen van posities voor meerdere domeinen tegelijk

Toepassingen

  • Controleren van posities van eigen websites en die van concurrenten
  • Zoeken naar pagina's met veel verkeer op een website

Zoekopdrachten

Als zoekopdrachten moet u het domein van de gezochte website en de zoekterm opgeven, gescheiden door een spatie, bijvoorbeeld:

lenta.ru nieuws   
lenta.ru nieuws online
ria.ru nieuws
a-parser.com A-Parser

Als u één website wilt controleren op een lijst met zoekopdrachten, kunt u het domein opgeven in het formaat van de zoekopdracht (Query format):

lenta.ru $query

Of gebruik gewoon een lijst met trefwoorden. Om meerdere domeinen tegelijk in een zoekopdracht te gebruiken, moet u een lijst met domeinen gescheiden door komma's opgeven, gevolgd door een spatie en het trefwoord, bijvoorbeeld:

lenta.ru,ria.ru,notfound.com nieuws feed

De resultaten worden opgeslagen in de array $bulkcheck. De optie Stop when found wordt ook ondersteund; de gegevensextractie eindigt als voor alle domeinen posities zijn gevonden.

Zoekopdracht-substituties

U kunt ingebouwde macro's gebruiken voor automatische substitutie van subquery's uit bestanden. Stel dat we websites/een website willen controleren tegen een database met trefwoorden, dan geven we enkele basiszoekopdrachten op:

ria.ru
lenta.ru
rbc.ru
yandex.ru

In het formaat van de zoekopdrachten geven we de macro op voor het invoegen van extra woorden uit het bestand Keywords.txt. Deze methode maakt het mogelijk om een database van websites te controleren tegen een database van trefwoorden en als resultaat de posities te verkrijgen:

$query {subs:Keywords}

Deze macro zal voor elke oorspronkelijke zoekopdracht evenveel extra zoekopdrachten maken als er in het bestand staan, wat resulteert in: [aantal oorspronkelijke zoekopdrachten (domeinen)] x [aantal zoekopdrachten in het bestand Keywords] = [totaal aantal zoekopdrachten] als resultaat van de macro.

Voorbeelden van resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in elke gewenste vorm kunnen worden uitgevoerd, evenals in gestructureerde formaten zoals CSV of JSON.

Export van de positielijst

Resultaat in de vorm van:

gezocht domein - trefwoord: positienummer in de zoekresultaten

Resultaatformaat:

$domain - $key: $position\n

Voorbeeld van resultaat:

lenta.ru - nieuws online: 13
lenta.ru - nieuws: 26
ria.ru - nieuws: 1
a-parser.com - A-Parser: 1
...

Gelijktijdige controle van meerdere domeinen (batchcontrole)

Informatie over alle domeinen bij een gelijktijdige controle van meerdere domeinen bevindt zich in de array $bulkcheck.

Resultaatformaat:

$bulkcheck.format('$domain - $position\n')

Voorbeeld van zoekopdracht:

lenta.ru,ria.ru,notfound.com nieuws feed

Voorbeeld van resultaat:

lenta.ru - 2
ria.ru - 6
notfound.com - 0

Net als in SE::Google.

Net als in SE::Google.

Net als in SE::Google.

Trefwoordconcurrentie

Net als in SE::Google.

Controle van linkindexering

Net als in SE::Google.

Opslaan in SQL-formaat

Net als in SE::Google.

Resultatendump in JSON

Net als in SE::Google.

Verwerking van resultaten

A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In dit gedeelte hebben we de meest populaire use-cases voor de scraper SE::DuckDuckGo::Position verzameld.

Domeinen opslaan zonder nul-posities

Als basis is het voorbeeld van de gelijktijdige controle van meerdere domeinen genomen (zie hierboven bij de uitvoeropties) en is er een filter toegevoegd.

Voeg een filter toe en kies in de vervolgkeuzelijst de variabele voor de positie-uitvoer. Kies type: >. Vul vervolgens bij Number (Getal) 0 in. Met dit filter kunt u alle resultaten met een nul-positie verwijderen.

Voorbeeld downloaden

Hoe een voorbeeld te importeren in A-Parser

eJx1VNtu2zAM/RVDCNAVyIJ2a4HBDwPSbhk2dE3Wy1OSB8WiWy2y6OmSXoL8+yhZ
ttNufYgi3g55SMpb5rhd25kBC86yfL5ldbyznF1/zfMvvliH3zfM8xla6STq7H12
zTeQCay41DZ7kO4evct49gwGszq5sSGrubFgAuz8TTRyE1Byrxwbbpl7qoFS4waM
kQLIKAXJ3kJt8PGJ5A1XnlxKrizs3o4o0VTcEZUI3EaxwcqrdXEPxXrUeLw7GDQ8
iNWgLX2x0AeHbA+9lMqBIZwEmM9ZBxR4tlyWw+R608R93kt9RHeso1vOLGjLdstl
i2gnsZpQYX08SiPojKHdN9jUAb16QtIlryIvwR0Ea0vrcOQeAwIXIpbGVZMhDKPP
eqvln1icRvKlq5FgJwYrUjmIAEH51FY3Z4MoB6I+xv5qYtJAhsxSqRNOhYjXFklt
4Q7NNPaA9FuGeqzUBWxA9W4R/8xLJWhzxiUFfU+B/3eZ/oOx6+jtp6L9eDBUQ4cS
pbPpzz5K4AXeEXOxIt5KVtKRbM/Ra5fmtwaou55dhp5VaKBLk5BTdnpUNeiwjP3I
xnWvekHjxVheKgvUpbybpgVvPb2+oZc71edY1QoCL+2VGoanctWvx9imMQShL/B1
8HlMEai3T5E5RGV/XDel1kbS+p2GAivq5H7WBFlwpW6vLvYtrF8pEhRox0fGD42M
fxpdSZ0VowKrbOGPTj6KeEI8P/T3k+N4NppPjesqnqd9WDKHGRX0Eu6QdpT6tFt2
H6HuE7d9+1OUb3e0Br/trAkJPQsBpKPm2+hxvPsLSinNVw==
tip

Net als in SE::Google.

Net als in SE::Google.

Domeinen extraheren

Net als in SE::Google.

Tags verwijderen uit ankers en snippets

Net als in SE::Google.

Net als in SE::Google.

Mogelijke instellingen

Ondersteunt alle instellingen van de scraper SE::DuckDuckGoSE::DuckDuckGo, evenals extra:

Naam parameterStandaardwaardeBeschrijving
Result format$domain - $key: $position\nStandaardformaat voor resultaatuitvoer
Stop when foundGegevensextractie stoppen als het domein is gevonden; gaat niet verder naar de volgende pagina's
Match typeExact domainMogelijkheid om de gezochte positie te vergelijken op domein, op hoofddomein en op volledige link (Exact domain / Top level domain / Exact url)