SE::Yandex::WordCraft - Scraper WordCraft. Selezione delle query e analisi di mercato

Panoramica dello scraper
Yandex WordCraft (Vordkraft) è una parte del servizio Yandex Webmaster, con cui è possibile selezionare query mirate per la promozione e la pubblicità, considerando la popolarità e l'ambiente competitivo. Sono disponibili centinaia di milioni di query uniche per l'analisi. Domanda, visualizzazioni, clic e posizioni sono forniti con una media mensile basata sull'anno passato.
Lo scraper di query Yandex WordCraft supporta la moltiplicazione automatica delle query, garantendo di ottenere il numero massimo di risultati dai risultati di ricerca.
La funzionalità di A-Parser consente di salvare le impostazioni di scraping per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati durante lo scraping di Yandex Wordstat.
Il salvataggio dei risultati è possibile nella forma e nella struttura necessarie, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui TXT, JSON, SQL e CSV.
Account
Per il funzionamento dello scraper
SE::Yandex::WordCraft sono necessari account Yandex. Gli account possono essere registrati utilizzando lo scraper
SE::Yandex::Register o semplicemente aggiungendo gli account esistenti nel file files/SE-Yandex/accounts.txt nel formato supportato.
In alternativa, è possibile abilitare la registrazione degli account "al volo".
Per lavorare utilizzando l'autorizzazione per sessione, è necessario che la stringa con i dati sia in questo formato:
[email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}
Dati raccolti
- Query degli utenti (principali):
- Query, competitività, domanda, clic
- Query degli utenti (aggiuntive):
- Query, competitività, domanda, clic
- Siti popolari nella ricerca Yandex (siti):
- Sito, frequenza di visualizzazione, posizione media
- Siti popolari nella ricerca Yandex (pagine):
- URL, frequenza di visualizzazione, posizione media, numero di query, titolo
Casi d'uso
- Valutazione della competitività per parola chiave (domanda, clic)
- Ricerca di nuove parole chiave di argomenti simili
- Raccolta di grandi database di parole chiave di diversi argomenti
- Qualsiasi altro scenario che implichi lo scraping di Yandex Webmaster WordCraft in un modo o nell'altro
Query
Come query, è necessario specificare le parole chiave, esattamente come se venissero inserite direttamente nel campo di ricerca della query di WordCraft, ad esempio:
aspirapolvere
seo
Esempi di output dei risultati
A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma arbitraria, così come in forma strutturata, ad esempio CSV o JSON
Output predefinito
Esempio di output dell'elenco delle query degli utenti (principali). Formato del risultato:
User queries general: $uqg.format('$query,$compet,$demand,$clicks\n')
L'elenco risultante:
aspirapolvere,HIGH,33190,9248
aspirapolvere,HIGH,31204,8768
aspirapolvere,HIGH,14097,6082
...
aspirapolvere,HIGH,791,656
Per visualizzare i risultati utilizzando il Formato dei risultati generale è necessario specificare il numero dello scraper nell'attività - $p1. (parser 1) o p1. se si utilizza il motore di modelli Template Toolkit. Ad esempio:
User queries general: $p1.uqg.format('$query,$compet,$demand,$clicks\n')
Per informazioni sul Formato dei risultati generale, vedere Modifica del formato del risultato
Output in tabella CSV
Esempio di output dell'elenco delle query degli utenti (principali) in una tabella CSV. Formato del risultato:
[%
FOREACH uqg;
tools.CSVline(query,compet,demand,clicks);
END;
%]
Esempio di output dell'elenco delle query degli utenti (aggiuntive) in una tabella CSV. Formato del risultato:
[%
FOREACH uqa;
tools.CSVline(query,compet,demand,clicks);
END;
%]
Esempio di output dell'elenco dei siti popolari nella ricerca Yandex (siti) in una tabella CSV. Formato del risultato:
[%
FOREACH rs;
tools.CSVline(site,popul,position);
END;
%]
Esempio di output dell'elenco dei siti popolari nella ricerca Yandex (pagine) in una tabella CSV. Formato del risultato:
[%
FOREACH rp;
tools.CSVline(url,popul,position,queries,title);
END
%]
Vedere anche: Filtri dei risultati
Opzioni
- Parse queries for Rivals pages - abilitando questa opzione, vengono raccolte le query popolari per ciascuno dei link in Rivals pages. I dati raccolti vengono registrati come oggetto JSON nella variabile
$rp.$i.queries_json. L'abilitazione di questa opzione aumenta notevolmente il tempo di scraping, poiché lo scraper effettua molte sotto-query aggiuntive.
Impostazioni possibili
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| AntiGate preset | default | È necessario configurare preventivamente lo scraper Util::AntiGate - specificare la propria chiave di accesso e altri parametri, quindi selezionare il preset creato qui |
| AntiGate preset for Login | default | Preset AntiGate per il login. È necessario configurare preventivamente lo scraper Util::AntiGate con i parametri, quindi selezionare il preset creato qui |
| Accounts | Only from "accounts.txt" | Scelta del metodo di lavoro con gli account: Always auto register - registra sempre automaticamente gli account "al volo", è necessario selezionare un preset configurato nel parametro SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - vengono prima utilizzati gli account esistenti da accounts.txt e, se finiscono, viene utilizzata la registrazione automatica "al volo", per la quale è necessario selezionare un preset configurato nel parametro SE::Yandex::Register preset. Only from "accounts.txt" - utilizza solo gli account esistenti da accounts.txt e, se finiscono, attende il tempo specificato (parametro Wait new accounts in "accounts.txt") per la comparsa di nuovi. Only by session_id from "accounts.txt" - autorizzazione tramite cookie. |
| Wait new accounts in "accounts.txt" | 0 | Tempo di attesa per la comparsa di nuovi account in accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Eliminazione automatica degli account "cattivi": Always - elimina sempre. Always, except wrong login/password - elimina sempre, tranne nei casi in cui Yandex ha segnalato che il login/password inseriti non sono corretti. Il fatto è che Yandex può restituire tale messaggio in caso di ban dell'IP per un account assolutamente funzionante, quindi opzionalmente è possibile lasciare tali account per un riutilizzo. Never - non eliminare mai. Indipendentemente dall'opzione scelta, in caso di errori del proxy/browser gli account non vengono eliminati |
| SE::Yandex::Register preset | default | Scelta del preset di impostazioni per SE::Yandex::Register |
| Use sessions | ☑ | Utilizzo delle sessioni |
| Do not reset session if authorization passed | ☑ | Non resettare la sessione in caso di errori se lo scraper è già autorizzato |
| SE::Yandex::Register preset | default | Scelta del preset di impostazioni per SE::Yandex::Register |
