SE::Yandex - Scraper dei risultati di ricerca Yandex

Panoramica dello scraper

Lo scraper della SERP di Yandex è giustamente tra i primi 5 scraper più richiesti. Uno dei principali vantaggi competitivi del nostro scraper è la sua colossale produttività. Grazie al multithreading di A-Parser, la velocità di elaborazione delle query può raggiungere 3000-7000 query al minuto, il che consente mediamente di ottenere fino a 5.000.000 di link al minuto, con un consumo di risorse minimo; per il funzionamento è adatto qualsiasi computer da ufficio o domestico, così come qualsiasi VDS entry-level. Il nostro scraper supporta tutti gli operatori di ricerca di Yandex, il che consente di ampliare notevolmente le possibilità di scraping. La stabilità e la continuità dello scraping della SERP sono garantite dal riconoscimento dei captcha tramite AntiCaptcha o qualsiasi altra API supportata (Anti-Captcha, RuCaptcha, CapMonster.cloud, 2captcha e altre).

La flessibilità nelle impostazioni consente di specificare il tipo di SERP (mobile/desktop), la regione, la lingua, l'ordinamento della SERP per data e molto altro. Le funzionalità di A-Parser consentono di salvare le impostazioni di scraping per un uso futuro (preset), impostare programmi di scraping e molto altro. È possibile utilizzare la generazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati.

Il salvataggio dei risultati è possibile nella forma e nella struttura necessarie, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati ed esportare dati in vari formati, inclusi JSON, SQL e CSV.

Vai alla DEMO Acquista A-Parser Pro ($299)

Casi d'uso dello scraper

🔗 SERP di Yandex e numero di posizione

Otteniamo la SERP di Yandex e il numero di posizione del risultato. Il risultato viene salvato in un file csv.

🔗 Scraping della versione lite di Yandex

In questo articolo viene esaminato un esempio di creazione di uno scraper per raccogliere informazioni dalla versione lite del motore di ricerca Yandex.

🔗 Scraping di annunci pubblicitari da Yandex

Il preset analizza il blocco pubblicitario nei risultati di ricerca di Yandex e salva il risultato in formato json.

🔗 Valutazione della concorrenza in Yandex

Il preset determina la concorrenza nel motore di ricerca Yandex in base alle parole chiave.

🔗 Scraper della cache di Yandex

Il preset implementa la possibilità di ottenere link alla cache del motore di ricerca Yandex.

🔗 Scraping di soli snippet da Yandex

Questo preset accetta come parametro una parola o una frase per la ricerca in Yandex.

Dati raccolti

Numero di risultati per query
Link, anchor e snippet dalla SERP
- Vengono raccolte anche informazioni sui flag di ogni risultato; attualmente sono supportati i seguenti flag: Date, Image Preview, Video, Rich snippet, Featured snippet
Ora della prima e dell'ultima memorizzazione nella cache (solo per la SERP desktop)
Elenco delle parole chiave correlate (Related keywords)
Determina se Yandex ha considerato la query come un errore di battitura o meno
Scraping del link alla cache della pagina (solo per la SERP desktop)
Elenco dei nomi delle icone del sito e dei loro tipi, se presenti (incluso Turbo)
Blocchi pubblicitari superiore, medio e inferiore da tutte le pagine
- Link, link visibile, anchor, snippet e dominio
- Link e anchor aggiuntivi
- Stazione della metropolitana
Parole mancanti (parole che possono apparire sotto ogni risultato nella SERP con la nota "Non trovato")
Elenco delle risposte rapide (Quick answers): domande, risposte, link alle fonti (attivabile con l'opzione separata Parse Quick answers)
Risposta AI (Ricerca con Alice), il suo tipo e l'elenco delle fonti

Funzionalità

Scelta del tipo di SERP: mobile/desktop
Supporto per tutti gli operatori di ricerca di Yandex (site:, lang:, ecc.)
Esegue lo scraping del numero massimo di risultati forniti da Yandex - 25 pagine da 50 elementi nella SERP
Possibilità di cercare parole chiave correlate
Supporta la scelta della regione di ricerca, del dominio
Possibilità di ordinare la SERP per data
Esegue lo scraping dell'ora di indicizzazione della pagina, con possibilità di filtrare i risultati per questo parametro
Opzione di emulazione del browser (consente di ottenere un'alta velocità di scraping e un basso consumo di captcha)
Possibilità di aggirare i captcha utilizzando il servizio AntiCaptcha o qualsiasi altro che supporti la loro API (si consiglia di attivare il parametro is_russian nelle impostazioni dell'antigate)
Possibilità di impostare il numero di risposte rapide (Quick answers) che lo scraper deve raccogliere, cliccando in profondità su ogni domanda

Sulla base dello scraper Yandex funzionano i seguenti scraper:

SE::Yandex::Position - verifica delle posizioni del sito per parole chiave in Yandex

Casi d'uso

Raccolta di database di link - per A-Poster, XRumer, AllSubmitter, ecc.
Valutazione della concorrenza per le parole chiave
Ricerca di backlink (menzioni) di siti
Verifica dell'indicizzazione dei siti
Ricerca di siti vulnerabili
Qualsiasi altra variante che implichi lo scraping di Yandex in una forma o nell'altra

Query

Come query è necessario indicare frasi di ricerca, esattamente come se venissero inserite direttamente nel modulo di ricerca di Yandex, ad esempio:

finestre Mosca
lang:en windows Moscow
url:a-parser.com
site:a-parser.com
"a-parser.com"

Sostituzioni nelle query

È possibile utilizzare le macro integrate per moltiplicare le query; ad esempio, se vogliamo ottenere un database molto grande di forum, indichiamo alcune query di base in diverse lingue:

forum
forum
foro
论坛

Nel formato della query indichiamo l'iterazione dei caratteri da a a zzzz; questo metodo consente di ruotare al massimo la SERP e ottenere molti nuovi risultati unici:

$query {az:a:zzzz}

Questa macro creerà 475254 query aggiuntive per ogni query di ricerca iniziale, il che darà un totale di 4 x 475254 = 1901016 query di ricerca; una cifra impressionante, ma non è affatto un problema per A-Parser. Alla velocità di 2000 query al minuto, tale attività verrà elaborata in sole 16 ore.

Utilizzo degli operatori

È possibile utilizzare gli operatori di ricerca nel formato della query, in modo che vengano aggiunti automaticamente a ogni query della lista:

site:$query

Account

Per il funzionamento dello scraper SE::Yandex potrebbero essere necessari account Yandex. Gli account possono essere registrati utilizzando lo scraper SE::Yandex::Register o semplicemente aggiungendo gli account esistenti al file files/SE-Yandex/accounts.txt nel formato supportato.

Oppure è possibile attivare la registrazione degli account "al volo".

Per lavorare utilizzando l'autorizzazione per sessione, è necessario che la stringa con i dati sia in questo formato: [email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}

Esempi di output dei risultati

A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON

Esportazione della lista di link

Formato del risultato:

$serp.format('$link\n')

Esempio di risultato:

https://TestoMetrika.com/tests/
https://onlinetestpad.com/ru/tests
https://www.speedtest.net/
https://ustaliy.ru/testi/
https://yandex.ru/internet/
https://konstruktortestov.ru/popular
https://TestEdu.ru/test/
https://kto-chto-gde.ru/category/tests/
https://weekend.rambler.ru/tests/
https://GadalkinDom.ru/test
...

Link + anchor + snippet con output della posizione

Formato del risultato:

[% FOREACH item IN serp;    loop.count _ ' - ' _ item.link _ ' - ' _ item.anchor _ ' - ' _ item.snippet _ "\n"; END %]

Esempio di risultato:

- http://forum.r-rp.ru/ - <b>forum</b>.r-rp.ru - 
- https://forum.arizona-rp.com/ - <div class=a11y-hidden>Risultato web con link aggiuntivi</div><b>Forum</b> – Arizona Role Play - Menu. Home. <b>Forum</b>. Nuovi messaggi. Cosa c'è di nuovo? Nuovi messaggi. Utenti. Visitatori attuali. <b>Forum</b>. Accedi. ... Statistiche del <b>forum</b>. Discussioni. 1,247,176. Messaggi. 5,225,340. Utenti. 623,675. 
- https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC - <b>Forum</b> — Wikipedia - <b>Fórum</b> (lat. <b>forum</b> — arch. vestibolo della tomba; area nel torchio per l'uva da lavorare; piazza del mercato, mercato cittadino; mercato, piazza centrale):
- https://zen.yandex.ru/media/propromotion/chto-takoe-forum-i-vse-chto-s-nim-sviazano-5d65164c1d656a00ad52ba30 - Cos'è un <b>forum</b> e tutto ciò che lo riguarda | Creativa... - Oggi parleremo di cos'è un <b>forum</b> e di tutto ciò che lo riguarda con parole semplici e accessibili. Ognuno di noi cerca di trovare una persona con cui costruire una comunicazione su interessi comuni, condividere la propria esperienza, dare consigli. Nel mondo moderno, tutto questo è diventato possibile senza uscire di casa. Proprio una delle forme di tale contatto virtuale è il web-<b>forum</b>. 
- https://forum.vimeworld.ru/ - VimeWorld - <b>Forum</b> - <b>Forum</b> del progetto di server di gioco ideali Minecraft - VimeWorld...
...

Output di link, anchor e snippet in una tabella CSV

L'utility integrata $tools.CSVLine consente di creare documenti tabulari corretti, pronti per l'importazione in Excel o Google Fogli.

Formato generale del risultato:

[%  FOREACH i IN p1.serp;    tools.CSVline(i.link, i.anchor, i.snippet); END  %]

Nome del file:

$datefile.format().csv

Testo iniziale:

Link,Anchor,Snippet

suggerimento

Nel Formato generale dei risultati viene applicato il motore di modelli Template Toolkit per l'output dell'array $serp in un ciclo FOREACH.

Nel nome del file dei risultati è sufficiente cambiare l'estensione del file in csv.

Affinché l'opzione "Testo iniziale" sia disponibile nell' Editor delle attività, è necessario attivare "Più opzioni". In "Testo iniziale" scriviamo i nomi delle colonne separati da virgola e rendiamo vuota la seconda riga.

Output dei blocchi pubblicitari

Formato del risultato:

$ads.format('$link - $anchor - $snippet\n')

Esempio di risultato:

http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&amp;q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&amp;etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Acquista</b> <b>biglietto aereo</b> per / aviasales.ru - Offriamo: <b>Acquista</b> <b>biglietto aereo</b> per qui. Super offerta! Affrettati!
http://yabs.yandex.ru/count/WgGejI_zO5e2rHG092HY-_ryhkYFF0K0MWCnZYWCO000000u109mhDZpa8WGW07ZZm680U2f-wrQa07AywxRoe20W0AO0ShphjjAk06oWAxe8C01NDW1e8MobW7W0TJCXm_e0O01c0BImFq2e0BuQjW20l02g_w3YWNu0l3gyU2XnhZLvG600vF6eiSFY0FStR-O39W3cyKxYga3-0JJpWI81TFE1905Z-zGe0MPj06e1PMM0R05bPO1k0NInnJ01TF1ZG781PNz8uheD8-kAs27sGO0000GaG000Aa7xtUKqlAB7m6m1u20c0ou1u05yGTxKlEQZtj_VeI2l3M02W712l_aZtPQIU8_oGeJ5NRdMhxJFweB4E0yOqplTm00p5BUXP6v1G3P2-WBqyu4y0i6Y0ookzw-0QaCu_jL-Yu3zB_e3AC2u0s3W810YGwgO5HI9w3dYj7J-UZrYh27s0u2-0x7dPAe2Q4FFGhNet0zzZ_P3_0_W13GmC4Rm92GPpgqxC9xJZC_iHAuM7p6uhZj0k0JqiSKe1JInnIe58_lKB0KYw381hWKmAo0jQI04TWK-FpP_WNe58m2q1Nu_Dd-1TWLmOhsxAEFlFnZyA0Mq92TW0R95j0MihlUlW615vWNfwZz3wWN2S0Nj0BO5y24FPaOe1WAi1Z9fB201j0O8VWOgVYRg8x-yPebW1cmzBZYqBsHkI2G6G6W6S83i1cu6V___m7I6H9vOM9pNtDbSdPbSYzoD3atBJBe6O320_0PWC83WHh__oD2TTsApne0jsLWrgrT_2INXiZt8r8kcvWxe0SCE37tPBmjEYG0203ecjreFlD0AY-khXXjgcFZa190IXd9BOrkl3guMzzraExES_xHXH4WwWDq1xIoUlHJ6Y74~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&amp;q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&amp;etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Acquista</b> <b>biglietto aereo</b> online su Tutu.ru! Sito ufficiale! - Biglietti aerei a basso prezzo! Voli vantaggiosi in tutto il mondo! <b>Acquista</b> biglietto online!
http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&amp;q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&amp;etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Acquista</b> <b>biglietto aereo</b> per / aviasales.ru - Offriamo: <b>Acquista</b> <b>biglietto aereo</b> per qui. Super offerta! Affrettati!
...

Formato del risultato:

$related.format('$key\n')

Esempio di risultato:

<b>test</b> tanki online
tanki online
tutti i <b>test</b> punto ru
i exam ru test
<b>test</b> velocità internet
<b>tests</b>24.ru
speedtest
test<b>prestazioni pc</b> online
test online
my <b>test</b> student come scoprire le risposte
...

suggerimento

Per rimuovere automaticamente i tag HTML nel risultato, è necessario utilizzare il Costruttore di risultati, selezionare l'array $related e applicare Remove HTML tags.

Concorrenza delle parole chiave

Formato del risultato:

$query - $totalcount\n

Esempio di risultato:

tutti i test punto ru - 25000000
test online - 13000000
tanki online - 7000000
i exam ru test - 27000000
tests24.ru - 238000000
test online prestazioni pc - 16000000
speedtest - 2000000
test velocità internet - 16000000
test tanki online - 19000000
my test student come scoprire le risposte - 16000000

Definizione di parole chiave con errori

Formato del risultato:

$query - $misspell\n

Esempio di risultato:

test online - 0
test velocità internet - 0
test onlain - 1
test velocià intrnet - 1

Verifica dell'indicizzazione dei link

Formato della query:

site:$query

Formato del risultato:

$query.orig - $totalcount\n

Esempio di risultato:

https://a-parser.com/pages/buy - 2
https://a-parser.com/wiki/parsers - 16
https://trjkjfkdf.bg.ky - 0
https://a-parser.com/resources - 1000
https://a-parser.com/forum - 499

suggerimento

Per verificare l'indicizzazione dei link, inseriamo nel Formato della query l'operatore corrispondente: site:.

Il formato del risultato viene visualizzato come "url originale - numero di pagine nell'indice".

Come risultato otteniamo l'indirizzo delle pagine e il loro numero nell'indice del motore di ricerca.

Se la pagina è assente, il risultato sarà: 0.

Salvataggio in formato SQL

Formato del risultato:

[%  FOREACH serp;   "INSERT INTO serp VALUES('" _ query _ "', '";   link _ "', '";  anchor _ "')\n"; END  %]

Esempio di risultato:

INSERT INTO serp VALUES('test', 'https://konstruktortestov.ru/popular', 'Popolari <b>test</b>')
INSERT INTO serp VALUES('test', 'https://TestoMetrika.com/tests/', ' <b>Test</b> c online con risultati accurati da psicologici...')
INSERT INTO serp VALUES('test', 'https://ustaliy.ru/testi/', ' <b>Test</b> online: i migliori, interessanti e popolari')
INSERT INTO serp VALUES('test', 'https://www.SunHome.ru/tests/Interesting_tests', 'Interessanti <b>test</b>. Sottoponiti a interessanti test psicologici...')
INSERT INTO serp VALUES('test', 'https://onlinetestpad.com/ru/tests', ' <b>Test</b> online | Online Test Pad')
...

Dump dei risultati in JSON

Formato comune del risultato:

[% IF notFirst;
  ",\n";
ELSE;
  notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.links = [];

FOREACH item IN p1.serp;
    obj.links.push(item.link);
END;

obj.json %]

Testo iniziale:

Testo finale:

Esempio di risultato:

[{"totalcount":113000000,"links":["https://TestoMetrika.com/tests/","https://konstruktortestov.ru/popular","https://ustaliy.ru/testi/","https://www.SunHome.ru/tests/Interesting_tests","https://GadalkinDom.ru/test","https://zen.yandex.ru/tes","https://onlinetestpad.com/ru/tests","https://kto-chto-gde.ru/category/tests/","https://psytests.org/top.html","https://MixTests.com/new/","https://TestEdu.ru/test/","https://testserver.pro/index","https://onedio.ru/tests","https://BankTestov.ru/","https://weekend.rambler.ru/tests/","https://edieta.org/testi","https://trikky.ru/?%21","https://BBF.ru/tests/","https://dropi.ru/c/tests/raznie","https://cadelta.ru/tests","https://www.Elle.ru/tests/","https://www.adme.ru/svoboda-psihologiya/polnyj-spisok-psihologicheskih-testov-dlya-poznaniya-sebya-kotorye-mozhno-projti-onlajn-2071715/","https://www.ellegirl.ru/tests/","https://test.tankionline.com/","https://vraki.net/onlajn-testy/","https://Lifehacker.ru/psixologicheskie-testy/","https://iq2u.ru/tests","https://www.b17.ru/tests/","https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82","https://gurutest.ru/test/","https://www.psychologies.ru/tests/","https://peopletalk.ru/category/tests/","https://obrazovaka.ru/testy","https://likeyou.io/category/test/","https://ProfTest.me/tests","https://TayniyMir.com/testy","https://psi-technology.net/psytest/","https://www.kp.ru/putevoditel/online-test/","https://tvoytest.ru/","https://twizz.ru/tests/","https://lunanews.net/testy/","https://www.ivi.ru/titr/tests","https://sntch.com/tests/","https://testy.online/","https://videouroki.net/tests/","https://www.speedtest.net/ru","https://rb.ru/tests/","https://aznaetelivy.ru/tests/","https://woman-psy.com/psihologicheskie-testy/testy_na_eruditsiyu_i_znaniya/interesnye_testy/","https://mamochka-club.com/psihologicheskie-testy/interesnye-testy/"]}]

suggerimento

Affinché le opzioni "Testo iniziale" e "Testo finale" siano disponibili nell' Editor delle attività, è necessario attivare "Più opzioni".

Elaborazione dei risultati

A-Parser consente di elaborare i risultati direttamente durante lo scraping; in questa sezione abbiamo riportato i casi più popolari per lo scraper Yandex

Deduplicazione dei link

Aggiungere la deduplicazione e selezionare dall'elenco a discesa $serp.$i.link - Link.

Scarica esempio

Come importare l'esempio in A-Parser

eJx9VE2P2jAQ/SurEYdWQqvQLpfcWFSqVnTZLuyhohy8ZIJcHNu1HQqK+O+dCUkc
ttVeoszze/NtVxCE3/tHhx6Dh3Rdga3/IYXlpzT9IXSGx5u51Ht/86zl7xJhCFY4
j47p6x6LDjLMRakCDCsIJ4vkxBzQOZmxSmZkW2eOJ4fBSfSEHYQqmTZKkgTOb8jE
Drem1CFqRm/QFedr0bEsKsZJT1K2xVC5nHK6BqrJEsBi2AwbxupC95Sx3kGLflbm
RShIgyvxvNm0XvzMuEJw8wZ2dNt0sjtcigOuDB3mUsXIfkbWgyg4yiATAfn0Nq8d
vXt/G47sQWSZDNJooS4RuPcxajOYFLQhLv1yd2fOFAQFrB0weGqzW8OgtmOV3y8a
SHOhPA7BU6ozQYlkr09kQCeCcQvL+RBegdETpeZ4QBVptf/7UqqMFmWSk+hLI/w/
ZfGPj3NXXj8UDfqPoxw6L7V1v/gWVZmZmx1Vnr3UwyxkINtP6+1JISFwj2i7nj1w
zwrjsAvTeG6i092wqHmr4sgmNkJXZVyN5RrcGp3L3aLZ1JZZ6hVdwIWemsIq5Lp0
qRSNxeNTXI+Jb8bARkzwtXhah+DS23sIwRjlvy4vqVonaf3GnGBBnexHbVxuhVLP
T/P+CcSVIuNnmdzdfeDvx3H9P7ogwNqAO0NbRZWdN90r0b0tVf+tSKszjeqXf7yQ
uC6mEEYN8jQHvuB/AYBymo0=

suggerimento

Vedere anche: Deduplicazione dei risultati

Deduplicazione dei link per dominio

Aggiungere la deduplicazione e selezionare dall'elenco a discesa $serp.$i.link - Link. Scegliere il tipo di deduplicazione: Dominio.

Scarica esempio

Come importare l'esempio in A-Parser

eJx9VE2P2jAQ/SvI4tBKCIV2ueTG0lK1ost2YQ8V5WDIBLk4tms7FBTx33fGCXHY
VnuxPG/mzbddMc/dwT1acOAdS9cVM+HOUrb8nKY/ucrg1JsLdXC9ZyX+lNDbnnuf
dMGFYgNmuHVgibju2KMig5yX0rNBxfzZALrTR7BWZIBKkaFsrD6dLXgrwCF25LIk
s1GSJOzyBo3vYadL5SNn9Ia5pMwNWKJFxjjpUMpQFiqxcEo5XTOsySBAZLYZNBar
2jy71l6jX6TecslSb0u4bDZXL26mbcGpjX0zGjY9bZVLfoSVRmUuZIzsZig98IKi
9DPugbTDPDh6937oT+SBZ5nwQisu6wjU+xi1HhHylUZbvFJ3Z1YXCHkIDgg8X7Nb
s36QY5U/ag5Lcy4dDJjDVGccE8lea4QHy722C0P5IF4xrSZSzuEIMpoF//elkBku
yiRH0teG+H+TxT8+Lm153VA46L8Wc2i9BOl+8T2yMj3XexrZNgyzEB5lNw3bk7IE
wQOAaXv2QD0rtIU2TOO5iY6vxICirYojm5gI3ZRxM5ZbcKdVLvaLZlOvlqVa4VNc
qKkujASqS5VS4lgcPMX1mLhmDCTEBF+TpyEElX59h8xrLd23ZZ2qsQLXb0wJFtjJ
btTG5Y5L+fw072pYXCkUfpXJ3d0HOj+Ow31UI4y4HvYatworu2zaX6L9ZaruX5FW
FxzVb/dYG1FdZIIYNsjhHOiBvwAa7J3h

suggerimento

Vedere anche: Deduplicazione dei risultati

Estrazione dei domini

Aggiungere il Costruttore di risultati e selezionare la fonte dall'elenco a discesa: $p1.serp.$i.link - Link. Scegliere il tipo: Extract Domain.

Scarica esempio

Come importare l'esempio in A-Parser

eJx9VEtv2zAM/isFkcMGBIGzNRff0qwBNmRN17SHIetBi+lAiyxpkpwlMPzfR8qO
7XZDL4b5+Eh+fKiCIPzB3zv0GDyk2wps/IcUNrdp+l3oDE9Xt6fgxC5cfTKFkNrD
GKxwHh0jtgNHMmSYi1IFGFcQzhYpjjmiczJDMsqMZOvM6ewwOIkc6ShUyW7TJEmg
fgMm9rgzpQ49ZvqGu5L64C06hvWIWVI/P4+BKFKNfmlcIZjqyE4nLe/OuBFHfDRk
zKXCXr0k6U4UnHKUiYBsneQx0Lv3k3DiCCLLZJBGC9Vk4Db1WZ+0/B0Za0O+9MuN
WDpTkCpgDMDK86W6LYyiDBSijNhvDQbSXCiPY/BU6lJQIdlriwzoRDBubbke0ldg
9FypFR5R9W4x/k0pVUYznecE+twC/++y/idG3dEbpqKZ/HFUQxclSjfrrz0qMyuz
J+bZT+KtZCEDyX4RB51CQsoDou16dsc9K4zDLk0buc1Om2xR8wL0I5vbXvWCxoux
DJQVeFO6HeXbJuMt0KLbWJw+AG9Pu3HYHEVzEzx158SZ9K17MO0WQk2YndG53K/b
Jb1kLvUjnd9aL0xhFXKfdKkUjdnjQ79uc9+OlYWe8GvwIqbgVl5OkGowyn/ZNNSt
k1TSjAkXNJlh1jbkTij19LAaWqBfURJ+lMn19Qf+fpzF/2mjAcYG3BvaUmLGhNsH
ontZquEzkVY1jf6Xv2+cmBe7kI4a5GmufNt/AaiMmIc=

suggerimento

Vedere anche: Costruttore di risultati

Rimozione dei tag da anchor e snippet

Aggiungere il Costruttore di risultati e selezionare la fonte dall'elenco a discesa: $p1.serp.$i.anchor - Anchor. Scegliere il tipo: Remove HTML tags.

Aggiungere nuovamente il Costruttore di risultati e selezionare la fonte dall'elenco a discesa: $p1.serp.$i.snippet - Snippet. Scegliere il tipo: Remove HTML tags.

Scarica esempio

Come importare l'esempio in A-Parser

eJyVVN9v2jAQ/lcii4dNQihs5SVvFA11Ey0dtA8T64NHLszDsT3bYaCI/313jknS
rqq0lyi+u++7X59dM8/d3t1bcOAdyzY1M+GfZWz9Kcu+cZXDMVlBqQ+Q3DzcLhLP
dy4prC6Tqdr+1NYlGJOslTCGKIbMcOvAEtmmx4GOHApeSc+GNfMnA5gCSa0VOaBT
5Hg2Vh9PFrwVQEwHLisKG6dpys5vwPgOtrpSvsOM3wiXQu2dAUuwDjFJz09PQ4bd
Y41urm3JaQoDMx7FkbTONT/Ag0ZnISR05jme7nhJKQc590DeURGI3r0f+SMx8DwX
XmjFZZOBxtRlfVTid+hYaYzFXxrEHGeNJg+BgIynS3UbNghnhhRVwH5tMCwruHQw
ZA5LnXMsJH/pER4s99ouDdWD9pppNZVyAQeQXVjgv66EzHGn0wJBnyPw9ZDlPxzn
tr1+KtzJH4s1tCzhdL287VC5Xugddp7/wL6lKIXHs5uFRWcsReMewLQzu6OZldpC
myYyx+wocgOKBNCtbGo607M2nq2lZ6yZ05XdYr5NOtwwFLqhrYabwEg/UXM23Jgb
X0pyW8tPaIzRnqQTISTT1xhdc5/+i/KCOSNmq1Uhdsuo/Es7lXrA675UM10aCTR8
VUmJ2nGw6jQ8dVErdOim+BI8CyloP5d7jWVo6b6sm3kaK7CqyTAW3s8aKbdcysfV
ou9hne7x8L1Kr64+0PfjJPyPGwsjrIedRuljZ9RwfHXal6zuvz1ZfUY9/XL3TRD1
RSFowwE5FAs9GH8BhLW+Jg==

suggerimento

Il Costruttore di risultati può essere aggiunto tutte le volte che è necessario.

Vedere anche: Costruttore di risultati

Filtrare i link per inclusione

Aggiungere un filtro e selezionare dall'elenco a discesa: $serp.$i.link - Link. Scegliere il tipo: Contiene la stringa. Successivamente, in Stringa è necessario scrivere il criterio di filtraggio; ad esempio, se vogliamo che vengano salvati solo i link che contengono .com, scriviamo questo in "Stringa".

Scarica esempio

Come importare l'esempio in A-Parser

eJx9VE2P2jAQ/SvI4tBKCMFhL7mxqEit6LJd2EOFOHjxJHJxbNd2KCjKf++ME+Kw
rfaW+Xhv3nw4NQvcn/yzAw/Bs2xfMxu/Wca2X7LsJ9cCLqOVVAGc1MXo7TryIX5J
PVJSn9iEWe48OELvByAMCMh5pQKb1CxcLSCnOYNzUgAGpUDbOnO5OkBG8Og7c1VR
2nw2m7HmAxgv4GgqHRJm/kE66fQWHMES4mE2gOSxQwxi9yQ52zPsyaIjNnmYdBm7
Nv1odOBSDyRPj6ZE09ggjUbbg/asORxujH5lXMlprmM7n3ZD7oNbfoadaXVAcuPc
4YmXxD8WPABFp3kk+vR5Gi7EwIWQVJOrtgLtIVV91fJ31KcN5uInTXrlUGvGAkQC
cl5v6vZsHG3quIrYHy2GZTlXHibMo9QVRyHifUTifHgwbhNngP6aGb1Qag1nUCkt
8j9WUgk8mkWOoK8d8P8pm384mr69YSlc+h+HGnqWaD1uvieUMGtTYOfiLS62lAFt
v4yXlLEZOk8Atp/ZE82sNA76Mh1zVx2fjQVNF5ZWtrDJddfG3VrunXhNuSw23dXe
Miu9w7e50UtTWgXUl66UwrV4eEnnsfDdGshIAt+Dl7EEtX57kywYo/y3bSvVOonn
90ACS5zksGpHeeRKvb6shxGWTiqekyfaI95pYfCCsIvm0P8d+l9MPfxHZHWDa/nl
n9sk6oFS0IfD8PElzZu/Z6ed/A==

suggerimento

Vedere anche: Filtri dei risultati

Impostazioni possibili

nota

Impostazioni comuni per tutti gli scraper

Nome parametro	Valore predefinito	Descrizione
AntiGate preset	`default`	Scelta del preset Util::AntiGate, dettagli sulla configurazione qui
AntiGate preset for old captcha	`default`	Simile a AntiGate preset, ma utilizzato solo per i captcha ordinari (vecchi, sotto forma di singola immagine). Se non viene selezionato un preset qui, per tali captcha verrà utilizzato il preset selezionato in AntiGate preset.
Experimental img captcha max count	`5`	Numero massimo di tentativi di captcha immagine ripetuti per tentativo
Preffered captcha type	`Click`	Scelta del tipo di captcha preferito: Click o Puzzle
Engine	`HTTP (Fast, JavaScript Disabled)`	Consente di scegliere il motore: HTTP (più veloce, ma maggiore probabilità di captcha) o browser (più lento, ma minore probabilità di captcha)
Device	`Modern desktop computer (Windows 10, Chrome 84)`	Scelta del tipo di SERP (Desktop computer / Mobile device)
Pages count	`5`	Numero di pagine da sottoporre a scraping (da 1 a 25)
Sort serp by date	`☐`	Ordinamento della SERP per data
Serp time	`All time`	Periodo di ricerca
Yandex domain	`www.yandex.ru`	Dominio Yandex per lo scraping, sono supportati tutti i domini (.ru, .ua, .by, .kz, .com.tr, .com). A partire dalla versione 1.1.345 viene selezionato automaticamente in base alla regione scelta.
Region of serp (lr=)	`Mosca`	Scelta della regione di ricerca (parametro lr=)
Custom region ID		Possibilità di specificare l'id di una regione non presente nel campo di selezione. Questa opzione ha la priorità sull'opzione Region of serp (lr=). È obbligatorio impostare il dominio corrispondente in Yandex domain.
Search sites from (rstr=)	`Not set`	Scelta del vincolo regionale dei siti (parametro rstr=)
Language	`Any`	Lingua dei risultati di ricerca (Russo, Inglese, Bielorusso, Francese, Tedesco, Indonesiano, Kazako, Tataro, Turco, Ucraino)
Parse not found	`☑`	Determina se eseguire lo scraping della SERP se per la query cercata sono stati trovati zero risultati ed è stata proposta una SERP per un'altra query
Not personalized	`☐`	Personalizzazione della ricerca. Dettagli qui
Filter pages	`Moderate filter`	Filtraggio dei risultati da contenuti indesiderati (Family search / Moderate filter / Do not filter)
Use Accounts	`☐`	Lavoro con gli account esistenti nel file files/SE-Yandex/accounts.txt. SE::Yandex::Register - Consente di registrare account in Yandex
Remove bad accounts	`☑`	Rimozione degli account non validi
Quick answers count	`0`	Numero massimo di domande-risposte (Quick answers) per ogni query che lo scraper deve raccogliere
Parse generative answer	`☐`	Se eseguire lo scraping della risposta generativa (questo aggiunge una sotto-query supplementare e di conseguenza rallenta il lavoro complessivo)
Accounts	`Only from "accounts.txt"`	Scelta del metodo di lavoro con gli account: `Always auto register` - registra sempre automaticamente gli account "al volo", è necessario selezionare un preset configurato nel parametro SE::Yandex::Register preset. `Auto register if no more in "accounts.txt"` - vengono prima utilizzati gli account esistenti da accounts.txt, e se terminano viene utilizzata la registrazione automatica "al volo", per la quale è necessario selezionare un preset configurato nel parametro SE::Yandex::Register preset. `Only from "accounts.txt"` - utilizza solo gli account esistenti da accounts.txt, e se terminano attende il tempo impostato (parametro Wait new accounts in "accounts.txt") per la comparsa di nuovi. `Only by session_id from "accounts.txt"` - autorizzazione tramite cookie.
Remove bad accounts	`Always, except wrong login/password`	Rimozione automatica degli account "cattivi": `Always` - rimuovi sempre. `Always, except wrong login/password` - rimuovi sempre, tranne nei casi in cui Yandex ha segnalato che sono stati indicati login/password errati. Il fatto è che Yandex può fornire tale messaggio in caso di ban dell'IP per un account assolutamente funzionante, quindi opzionalmente è possibile lasciare tali account per un riutilizzo. `Never` - non rimuovere mai. Indipendentemente dall'opzione scelta, in caso di errori del proxy/browser gli account non vengono rimossi
Use sessions	`☑`	Utilizzo delle sessioni
Wait new accounts in "accounts.txt"	`0`	Tempo di attesa per la comparsa di nuovi account in accounts.txt
SE::Yandex::Register preset	`default`	Scelta del preset di impostazioni per SE::Yandex::Register
Force neuro	`☐`	Attivazione forzata della risposta neurale, simile al passaggio manuale tra "Ricerca" e "Ricerca con Alice"

Panoramica dello scraper​

Casi d'uso dello scraper​

🔗 SERP di Yandex e numero di posizione

🔗 Scraping della versione lite di Yandex

🔗 Scraping di annunci pubblicitari da Yandex

🔗 Valutazione della concorrenza in Yandex

🔗 Scraper della cache di Yandex

🔗 Scraping di soli snippet da Yandex

Dati raccolti​

Funzionalità​

Casi d'uso​

Query​

Sostituzioni nelle query​

Utilizzo degli operatori​

Account​

Esempi di output dei risultati​

Esportazione della lista di link​

Link + anchor + snippet con output della posizione​

Output di link, anchor e snippet in una tabella CSV​

Output dei blocchi pubblicitari​

Salvataggio delle parole chiave correlate​

Concorrenza delle parole chiave​

Definizione di parole chiave con errori​

Verifica dell'indicizzazione dei link​

Salvataggio in formato SQL​

Dump dei risultati in JSON​

Elaborazione dei risultati​

Deduplicazione dei link​

Deduplicazione dei link per dominio​

Estrazione dei domini​

Rimozione dei tag da anchor e snippet​

Filtrare i link per inclusione​

Impostazioni possibili​

Panoramica dello scraper

Casi d'uso dello scraper

Dati raccolti

Funzionalità

Casi d'uso

Query

Sostituzioni nelle query

Utilizzo degli operatori

Account

Esempi di output dei risultati

Esportazione della lista di link

Link + anchor + snippet con output della posizione

Output di link, anchor e snippet in una tabella CSV

Output dei blocchi pubblicitari

Salvataggio delle parole chiave correlate

Concorrenza delle parole chiave

Definizione di parole chiave con errori

Verifica dell'indicizzazione dei link

Salvataggio in formato SQL

Dump dei risultati in JSON

Elaborazione dei risultati

Deduplicazione dei link

Deduplicazione dei link per dominio

Estrazione dei domini

Rimozione dei tag da anchor e snippet

Filtrare i link per inclusione

Impostazioni possibili