SE::Rambler - Scraper dei risultati di ricerca Rambler

Panoramica dello scraper
Scraper della SERP di Rambler. Grazie allo scraper Rambler potrai ottenere ampi database di link pronti per un ulteriore utilizzo. Puoi utilizzare le query nello stesso formato in cui le inserisci nella barra di ricerca di Rambler, inclusi gli operatori di ricerca (site, ip, ecc.).
La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Rambler per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. Puoi utilizzare la generazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati.
Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di template integrato Template Toolkit che permette di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.
Dati raccolti
- Numero di risultati nella SERP
- Link, anchor e snippet dalla SERP
- Elenco di parole chiave correlate (hints)

Funzionalità
- Supporto per gli operatori di ricerca di Rambler (url:, site:, inurl:, host:, rhost:, domain:.)
- Scraper fino a 25 pagine, da 10 a 50 risultati per pagina
- Scraper delle parole chiave correlate ($hints)
- Possibilità di utilizzare servizi di risoluzione per bypassare i captcha
- Scelta del dispositivo di output: desktop standard, mobile Android o mobile iOS
Casi d'uso
- Raccolta di database di link
- Valutazione della concorrenza per parole chiave
- Ricerca di backlink (menzioni) di siti
- Tutti i casi in cui è necessario sottoporre a scraping la SERP di Rambler
Query
Inserisci le query come faresti nella ricerca di Rambler. Supponiamo di aver bisogno solo dei link di un sito. Inseriamo nel campo delle query:
"acquistare porte" site:http://kp.ru
Sostituzioni nelle query
Puoi utilizzare i macro integrati per moltiplicare le query, ad esempio se vogliamo ottenere un database molto grande di forum, indichiamo alcune query principali in diverse lingue:
forum
forum
foro
论坛
Nel formato della query indichiamo l'iterazione dei caratteri da a a zzzz, questo metodo permette di ruotare al massimo la SERP e ottenere molti nuovi risultati unici:
$query {az:a:zzzz}
Questo macro creerà 475254 query aggiuntive per ogni query di ricerca iniziale, il che darà un totale di 4 x 475254 = 1901016 query di ricerca, una cifra impressionante, ma non è affatto un problema per A-Parser. Con una velocità di 2000 query al minuto, tale attività verrà elaborata in sole 16 ore.
Utilizzo degli operatori
Puoi utilizzare gli operatori di ricerca nel formato della query, in questo modo verranno aggiunti automaticamente a ogni query della tua lista:
site:$query
Opzioni di output dei risultati
A-Parser supporta una formattazione flessibile dei risultati grazie al motore di template integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON
Esportazione dell'elenco dei link
Link + anchor + snippet con posizione
Output di link, anchor e snippet in una tabella CSV
Salvataggio delle parole chiave correlate
Formato del risultato:
$hints.format('$hint\n')
Esempio di risultato:
habrahabr
habr
habrahabr ru
xabra
livebusiness
eureka
contabile elettronico
isola d'elba
elba contabile elettronico
habrahabr
...
Salvataggio in formato SQL
Dump dei risultati in JSON
Elaborazione dei risultati
A-Parser consente di elaborare i risultati direttamente durante lo scraping, in questa sezione abbiamo riportato i casi d'uso più popolari per lo scraper Rambler
Deduplicazione dei link
Deduplicazione dei link per dominio
Estrazione dei domini
Rimozione dei tag da anchor e snippet
Filtrazione dei link per inclusione
Impostazioni possibili
| Nome parametro | Valore predefinito | Descrizione |
|---|---|---|
| Device | Desktop | Scelta del dispositivo di output: desktop standard, mobile Android o mobile iOS |
| Pages count | 5 | Numero di pagine da sottoporre a scraping (da 1 a 25) |
| Links per page | 10 | Numero di risultati per pagina (10/15/30/50) |
| Rambler region ID | Possibilità di impostare la regione. È necessario indicare l'ID della regione. Come trovare l'ID della regione desiderata è descritto qui | |
| Sort | Sites by relevance | Scelta dell'opzione di ordinamento dei risultati |
| Results filtering | Moderate | Scelta dell'opzione di filtraggio dei risultati |
| Results language | Any language | Scelta della lingua di ricerca dei risultati |
| Serp time | Anytime | Scelta del periodo dei risultati |
| Results type | Any format | Scelta del tipo di risultati (mime type) |
| Exact match | ☐ | Corrispondenza esatta alla query |
| Disable autocorrect | ☐ | Disabilita l'autocorrezione, consente di sottoporre a scraping la SERP esattamente per la query indicata |
| Use sessions | ☑ | Salva le sessioni valide, il che consente di sottoporre a scraping ancora più velocemente, ottenendo un numero minore di errori |
| AntiGate preset | default | Definisce se utilizzare Util::AntiGate per bypassare i captcha |
