SE::Yandex::WordCraft - Scraper för WordCraft. Sökordsval och marknadsanalys

Översikt av scrapern
Yandex WordCraft (Wordcraft) är en del av tjänsten Yandex Webmaster, med vilken du kan välja målsökord för marknadsföring och reklam, med hänsyn till popularitet och konkurrensmiljö. Hundratals miljoner unika sökfrågor är tillgängliga för analys. Efterfrågan, visningar, klick och positioner visas som ett genomsnitt per månad för det gångna året.
Scrapern för sökfrågor Yandex WordCraft stöder automatisk multiplikation av sökfrågor, så att du kan vara säker på att få maximalt antal resultat från sökresultaten.
Funktionaliteten i A-Parser gör det möjligt att spara inställningar för dataskrapning för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av sökfrågor, substitution av undersökfrågor från filer, iteration av alfanumeriska kombinationer och listor för att få största möjliga mängd resultat vid dataskrapning av Yandex Wordstat.
Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive TXT, JSON, SQL och CSV.
Konton
För att köra scrapers
SE::Yandex::WordCraft krävs Yandex-konton. Konton kan registreras med hjälp av scrapers
SE::Yandex::Register eller genom att helt enkelt lägga till befintliga konton i filen files/SE-Yandex/accounts.txt i ett format som stöds.
Alternativt kan du aktivera registrering av konton "i farten".
För att använda auktorisering via session måste dataraden vara i följande format:
[email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}
Insamlade data
- Användarfrågor (huvudsakliga):
- Sökfråga, konkurrens, efterfrågan, klick
- Användarfrågor (ytterligare):
- Sökfråga, konkurrens, efterfrågan, klick
- Populära webbplatser i Yandex sök (webbplatser):
- Webbplats, visningsfrekvens, genomsnittlig position
- Populära webbplatser i Yandex sök (sidor):
- URL, visningsfrekvens, genomsnittlig position, antal sökfrågor, rubrik
Användningsfall
- Bedömning av konkurrens per sökord (efterfrågan, klick)
- Sökning efter nya sökord inom liknande ämnen
- Insamling av stora databaser med sökord för olika ämnen
- Alla andra scenarier som innebär dataskrapning av Yandex Webmaster WordCraft i någon form
Sökfrågor
Som sökfrågor måste du ange sökord, precis som om du matade in dem direkt i sökfältet i WordCraft, till exempel:
dammsugare
seo
Exempel på resultatutmatning
A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att mata ut resultat i valfri form, såväl som i strukturerad form, till exempel CSV eller JSON
Standardutmatning
Exempel på utmatning av en lista med användarfrågor (huvudsakliga). Resultatformat:
User queries general: $uqg.format('$query,$compet,$demand,$clicks\n')
Resultatlista:
dammsugare,HIGH,33190,9248
dammsugare,HIGH,31204,8768
dammsugare,HIGH,14097,6082
...
dammsugare,HIGH,791,656
För att mata ut resultat med Allmänt resultatformat måste du ange scraperns nummer i uppgiften - $p1. (parser 1) eller p1. om mallmotorn Template Toolkit. används. Till exempel:
User queries general: $p1.uqg.format('$query,$compet,$demand,$clicks\n')
Se Redigering av resultatformat för vad Allmänt resultatformat är
Utmatning till CSV-tabell
Exempel på utmatning av en lista med användarfrågor (huvudsakliga) till en CSV-tabell. Resultatformat:
[%
FOREACH uqg;
tools.CSVline(query,compet,demand,clicks);
END;
%]
Exempel på utmatning av en lista med användarfrågor (ytterligare) till en CSV-tabell. Resultatformat:
[%
FOREACH uqa;
tools.CSVline(query,compet,demand,clicks);
END;
%]
Exempel på utmatning av en lista med populära webbplatser i Yandex sök (webbplatser) till en CSV-tabell. Resultatformat:
[%
FOREACH rs;
tools.CSVline(site,popul,position);
END;
%]
Exempel på utmatning av en lista med populära webbplatser i Yandex sök (sidor) till en CSV-tabell. Resultatformat:
[%
FOREACH rp;
tools.CSVline(url,popul,position,queries,title);
END
%]
Se även: Resultatfilter
Alternativ
- Parse queries for Rivals pages - när detta alternativ är aktiverat samlas populära sökfrågor in för var och en av länkarna i Rivals pages. Insamlade data sparas som ett JSON-objekt i variabeln
$rp.$i.queries_json. Aktivering av detta alternativ ökar skrapningstiden avsevärt, eftersom scrapern gör många extra underförfrågningar.
Möjliga inställningar
| Parameter | Standardvärde | Beskrivning |
|---|---|---|
| AntiGate preset | default | Du måste först konfigurera scrapern Util::AntiGate - ange din åtkomstnyckel och andra parametrar, och sedan välja den skapade förinställningen här |
| AntiGate preset for Login | default | AntiGate-förinställning för inloggning. Du måste först konfigurera scrapern Util::AntiGate med parametrar, och sedan välja den skapade förinställningen här |
| Accounts | Only from "accounts.txt" | Val av metod för att arbeta med konton: Always auto register - registrera alltid konton automatiskt "i farten", kräver att en konfigurerad förinställning väljs i parametern SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - först används befintliga konton från accounts.txt, och om de tar slut används automatisk registrering "i farten", för vilken en konfigurerad förinställning måste väljas i parametern SE::Yandex::Register preset. Only from "accounts.txt" - använd endast befintliga konton från accounts.txt, och om de tar slut - vänta den angivna tiden (parametern Wait new accounts in "accounts.txt") på att nya ska dyka upp. Only by session_id from "accounts.txt" - auktorisering via cookies. |
| Wait new accounts in "accounts.txt" | 0 | Väntetid för att nya konton ska dyka upp i accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Automatisk borttagning av "dåliga" konton: Always - ta alltid bort. Always, except wrong login/password - ta alltid bort, utom när Yandex meddelat att felaktigt användarnamn/lösenord angetts. Faktum är att Yandex kan ge ett sådant meddelande vid IP-blockering för ett helt fungerande konto, så man kan valfritt behålla sådana konton för återanvändning. Never - ta aldrig bort. Oavsett valt alternativ tas konton inte bort vid proxy-/webbläsarfel |
| SE::Yandex::Register preset | default | Val av förinställning för SE::Yandex::Register |
| Use sessions | ☑ | Användning av sessioner |
| Do not reset session if authorization passed | ☑ | Återställ inte sessionen vid fel om scrapern redan har auktoriserats |
| SE::Yandex::Register preset | default | Val av förinställning för SE::Yandex::Register |
