Vai al contenuto principale

SE::Rambler - Scraper dei risultati di ricerca Rambler

img

Panoramica dello scraper

Scraper della SERP di Rambler. Grazie allo scraper Rambler potrai ottenere ampi database di link pronti per un ulteriore utilizzo. Puoi utilizzare le query nello stesso formato in cui le inserisci nella barra di ricerca di Rambler, inclusi gli operatori di ricerca (site, ip, ecc.).

La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Rambler per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. Puoi utilizzare la generazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati.

Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di template integrato Template Toolkit che permette di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.

Dati raccolti

  • Numero di risultati nella SERP
  • Link, anchor e snippet dalla SERP
  • Elenco di parole chiave correlate (hints)

quali dati raccoglie lo scraper SE::Rambler

Funzionalità

  • Supporto per gli operatori di ricerca di Rambler (url:, site:, inurl:, host:, rhost:, domain:.)
  • Scraper fino a 25 pagine, da 10 a 50 risultati per pagina
  • Scraper delle parole chiave correlate ($hints)
  • Possibilità di utilizzare servizi di risoluzione per bypassare i captcha
  • Scelta del dispositivo di output: desktop standard, mobile Android o mobile iOS

Casi d'uso

  • Raccolta di database di link
  • Valutazione della concorrenza per parole chiave
  • Ricerca di backlink (menzioni) di siti
  • Tutti i casi in cui è necessario sottoporre a scraping la SERP di Rambler

Query

Inserisci le query come faresti nella ricerca di Rambler. Supponiamo di aver bisogno solo dei link di un sito. Inseriamo nel campo delle query:

"acquistare porte" site:http://kp.ru

Sostituzioni nelle query

Puoi utilizzare i macro integrati per moltiplicare le query, ad esempio se vogliamo ottenere un database molto grande di forum, indichiamo alcune query principali in diverse lingue:

forum
forum
foro
论坛

Nel formato della query indichiamo l'iterazione dei caratteri da a a zzzz, questo metodo permette di ruotare al massimo la SERP e ottenere molti nuovi risultati unici:

$query {az:a:zzzz}

Questo macro creerà 475254 query aggiuntive per ogni query di ricerca iniziale, il che darà un totale di 4 x 475254 = 1901016 query di ricerca, una cifra impressionante, ma non è affatto un problema per A-Parser. Con una velocità di 2000 query al minuto, tale attività verrà elaborata in sole 16 ore.

Utilizzo degli operatori

Puoi utilizzare gli operatori di ricerca nel formato della query, in questo modo verranno aggiunti automaticamente a ogni query della tua lista:

site:$query

Opzioni di output dei risultati

A-Parser supporta una formattazione flessibile dei risultati grazie al motore di template integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON

Esportazione dell'elenco dei link

Analogamente a SE::Google.

Analogamente a SE::Google.

Analogamente a SE::Google.

Formato del risultato:

$hints.format('$hint\n')

Esempio di risultato:

habrahabr
habr
habrahabr ru
xabra
livebusiness
eureka
contabile elettronico
isola d'elba
elba contabile elettronico
habrahabr
...

Salvataggio in formato SQL

Analogamente a SE::Google.

Dump dei risultati in JSON

Analogamente a SE::Google.

Elaborazione dei risultati

A-Parser consente di elaborare i risultati direttamente durante lo scraping, in questa sezione abbiamo riportato i casi d'uso più popolari per lo scraper Rambler

Analogamente a SE::Google.

Analogamente a SE::Google.

Estrazione dei domini

Analogamente a SE::Google.

Rimozione dei tag da anchor e snippet

Analogamente a SE::Google.

Analogamente a SE::Google.

Impostazioni possibili

Nome parametroValore predefinitoDescrizione
DeviceDesktopScelta del dispositivo di output: desktop standard, mobile Android o mobile iOS
Pages count5Numero di pagine da sottoporre a scraping (da 1 a 25)
Links per page10Numero di risultati per pagina (10/15/30/50)
Rambler region IDPossibilità di impostare la regione. È necessario indicare l'ID della regione. Come trovare l'ID della regione desiderata è descritto qui
SortSites by relevanceScelta dell'opzione di ordinamento dei risultati
Results filteringModerateScelta dell'opzione di filtraggio dei risultati
Results languageAny languageScelta della lingua di ricerca dei risultati
Serp timeAnytimeScelta del periodo dei risultati
Results typeAny formatScelta del tipo di risultati (mime type)
Exact matchCorrispondenza esatta alla query
Disable autocorrectDisabilita l'autocorrezione, consente di sottoporre a scraping la SERP esattamente per la query indicata
Use sessionsSalva le sessioni valide, il che consente di sottoporre a scraping ancora più velocemente, ottenendo un numero minore di errori
AntiGate presetdefaultDefinisce se utilizzare Util::AntiGateUtil::AntiGate per bypassare i captcha