Vai al contenuto principale

SE::Yandex::WordStat::ByDate - Scraper per le statistiche delle impressioni di Yandex WordStat per mesi o settimane

Yandex WordStat: ByDate

Panoramica dello scraper

Wordstat è un servizio di Yandex progettato per valutare l'interesse degli utenti per vari argomenti e selezionare parole chiave per l'ottimizzazione SEO e la pubblicità contestuale. Inoltre, con Wordstat Yandex è possibile valutare la stagionalità e la dipendenza geografica delle query di ricerca.

Lo scraper Yandex WordStat by date supporta la moltiplicazione automatica delle query, garantendo di ottenere il numero massimo di risultati dai dati forniti. Inoltre, A-Parser può navigare automaticamente attraverso le query correlate fino alla profondità specificata.

La funzionalità di A-Parser consente di salvare le impostazioni di scraping per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, la generazione di combinazioni alfanumeriche e liste per ottenere la massima quantità possibile di risultati.

Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, inclusi JSON, SQL e CSV.

Casi d'uso dello scraper

Account

Per il funzionamento dello scraper SE::Yandex::WordStat::ByDateSE::Yandex::WordStat::ByDate sono necessari account Yandex. Gli account possono essere registrati utilizzando lo scraper SE::Yandex::RegisterSE::Yandex::Register o semplicemente aggiungendo gli account esistenti al file files/SE-Yandex/accounts.txt nel formato supportato.

In alternativa, è possibile abilitare la registrazione degli account "al volo".

Dati raccolti

  • Statistiche delle parole chiave per mesi o settimane
  • Data
  • Valore assoluto
  • Valore relativo
Dati raccolti

Funzionalità

  • Supporta la selezione della regione di ricerca (con sottogruppi)
  • Possibilità di selezionare più regioni contemporaneamente per la valutazione
  • Supporto per il superamento automatico di Smart captcha e possibilità di superare i captcha grafici utilizzando il servizio AntiCaptcha o qualsiasi altro che supporti la loro API
  • Selezione del tipo di dispositivo
  • Possibilità di scegliere il metodo di autenticazione
  • Possibilità di registrare account "al volo"
  • Supporta il lavoro con il formato esteso degli account e sa rispondere alla domanda segreta (se la risposta è presente in info). Inoltre, utilizza per l'autenticazione il proxy salvato (se presente in info).

Varianti di utilizzo

  • Valutazione del volume di traffico per parola chiave
  • Identificazione di parole chiave stagionali

Query

Come query, è necessario specificare le parole chiave esattamente come se venissero inserite direttamente nel modulo di ricerca di Wordstat, ad esempio:

test

Esempi di output dei risultati

A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON.

Output predefinito

Formato del risultato:

Views:\n$views.format('$date $count $relcount\n')

Il risultato mostra le statistiche delle parole chiave per mese e per settimana:

Monthly:  
2011-09-30 3010832 0.0008903808
2011-10-31 681432 0.0001825883
2011-11-30 628532 0.0001575008
2011-12-31 629072 0.0001495699
2012-01-31 561206 0.0001300651
2012-02-29 572039 0.0001290000
2012-03-31 614897 0.0001225754
2012-04-30 520433 0.0001185340
2012-05-31 521967 0.0001235327
2012-06-30 502568 0.0001299958
...
Weekly:
2012-09-16 118715 0.0001222877
2012-09-23 120799 0.0001211773
2012-09-30 137809 0.0001365837
2012-10-07 133929 0.0001313643
2012-10-14 140373 0.0001293922
2012-10-21 136014 0.0001242209
2012-10-28 148350 0.0001293328
2012-11-04 139556 0.0001232566
2012-11-11 154830 0.0001314057
2012-11-18 136458 0.0001147489
2012-11-25 149463 0.0001261401
2012-12-02 144724 0.0001197564
2012-12-09 149142 0.0001212195
2012-12-16 162864 0.0001298181

Output in tabella CSV

Formato del risultato:

[% FOREACH i IN views;
tools.CSVline(query, i.count, i.date);
END %]

Esempio di risultato:

"test",9661734,2012-03-31
"test",8567243,2012-04-30
"test",9028986,2012-05-31
"test",6082099,2012-06-30
"test",5531950,2012-07-31
"test",5214663,2012-08-31
"test",6603865,2012-09-30
"test",9127457,2012-10-31
"test",9238652,2012-11-30

Salvataggio in formato SQL

Formato del risultato:

[% FOREACH i IN views;
"INSERT INTO views VALUES('" _ query _ "', '"; i.count _ "', '"; i.relcount _ "', '"; i.date _ "')\n";
END %]

Esempio di risultato:

INSERT INTO serp VALUES('test', '9661734', '0.0019259985', '2012-03-31')
INSERT INTO serp VALUES('test', '8567243', '0.0019512785', '2012-04-30')
INSERT INTO serp VALUES('test', '9028986', '0.0021368683', '2012-05-31')
INSERT INTO serp VALUES('test', '6082099', '0.0015732140', '2012-06-30')
INSERT INTO serp VALUES('test', '5531950', '0.0013160071', '2012-07-31')
INSERT INTO serp VALUES('test', '5214663', '0.0013327945', '2012-08-31')
INSERT INTO serp VALUES('test', '6603865', '0.0015936909', '2012-09-30')
INSERT INTO serp VALUES('test', '9127457', '0.0018740506', '2012-10-31')
INSERT INTO serp VALUES('test', '9238652', '0.0018308715', '2012-11-30')

Dump dei risultati in JSON

Formato comune del risultato:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.views = [];

FOREACH item IN p1.views;
obj.views.push({
date = item.date
relcount = item.relcount
count = item.count
});
END;

obj.json %]

Testo iniziale:

[

Testo finale:

]

Esempio di risultato:

[{
"views": [
{
"count": "9661734",
"date": "2012-03-31",
"relcount": "0.0019259985"
},
{
"count": "8567243",
"date": "2012-04-30",
"relcount": "0.0019512785"
},
{
"count": "9028986",
"date": "2012-05-31",
"relcount": "0.0021368683"
}
]
}]
suggerimento

Impostazioni possibili

ParametroValore predefinitoDescrizione
PeriodMonthlyScelta del periodo (Monthly/Weekly/Daily, Daily funziona solo con l'opzione Use Wordstat 2 abilitata)
Start date Specifica della data da cui eseguire la ricerca. Funziona solo con l'opzione Use Wordstat 2 abilitata. È obbligatorio considerare le regole per specificare la data
End date Specifica della data fino a cui eseguire la ricerca. Funziona solo con l'opzione Use Wordstat 2 abilitata. È obbligatorio considerare le regole per specificare la data
RegionAllRegione di ricerca
AntiGate presetdefaultÈ necessario configurare preventivamente lo scraper Util::AntiGateUtil::AntiGate - specificando la propria chiave di accesso e altri parametri, quindi selezionare il preset creato qui
AntiGate preset for LogindefaultPreset AntiGate per il login. È necessario configurare preventivamente lo scraper Util::AntiGateUtil::AntiGate con i parametri, quindi selezionare il preset creato qui
TypeAllScelta del tipo di dispositivo
AccountsOnly from "accounts.txt"Scelta del metodo di lavoro con gli account: Always auto register - registra sempre automaticamente gli account "al volo", richiede la selezione di un preset configurato nel parametro SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - prima vengono utilizzati gli account esistenti da accounts.txt, e se terminano viene utilizzata la registrazione automatica "al volo", per la quale è necessario selezionare un preset configurato nel parametro SE::Yandex::Register preset. Only from "accounts.txt" - utilizza solo gli account esistenti da accounts.txt, e se terminano attende il tempo specificato (parametro Wait new accounts in "accounts.txt") per la comparsa di nuovi
Wait new accounts in "accounts.txt"0Tempo di attesa per la comparsa di nuovi account in accounts.txt
Remove bad accountsAlways, except wrong login/passwordRimozione automatica degli account "cattivi": Always - rimuovi sempre. Always, except wrong login/password - rimuovi sempre, tranne nei casi in cui Yandex ha segnalato login/password errati. Il fatto è che Yandex può restituire tale messaggio in caso di ban dell'IP per un account perfettamente funzionante, quindi opzionalmente è possibile lasciare tali account per un riutilizzo. Never - non rimuovere mai. Indipendentemente dall'opzione scelta, in caso di errori di proxy/browser gli account non vengono rimossi
SE::Yandex::Register presetdefaultScelta del preset delle impostazioni per SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPMetodo di autenticazione: HTTP - veloce, poco esigente in termini di risorse. Chrome - lento, esigente in termini di risorse, teoricamente può prolungare la vita degli account
Chrome headlessSe l'opzione è abilitata, il browser non verrà visualizzato
Use sessionsUtilizzo delle sessioni
Do not reset session if authorization passedNon resettare la sessione in caso di errori se lo scraper è già autenticato
Use Wordstat 2Utilizzo di Wordstat 2
Wordstat 2 parse all table dataConsente di scaricare immediatamente tutti i 2000 risultati per query senza passare attraverso la paginazione