SE::Bing - Scraper dei risultati di ricerca Bing

Panoramica dello scraper
Scraper dei risultati di ricerca di Bing. Grazie allo scraper SE::Bing potrai ottenere enormi database di link pronti per un ulteriore utilizzo. Puoi utilizzare le query nello stesso formato in cui le inserisci nella barra di ricerca di Bing, inclusi gli operatori di ricerca (contains, intitle, language, site, ecc.). Maggiori dettagli sulla pagina ufficiale Advanced search keywords.
La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Bing per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. Puoi utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati.
Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.
Casi d'uso dello scraper
🔗 Scraping dei risultati di ricerca di Bing
Scraping di Bing con moltiplicazione automatica delle query (Parse all results)
🔗 Scraping della top 10 e del contenuto dei tag
Scraping multilivello. Estrazione della top 10 e del contenuto dei tag title e description per questi siti
🔗 Scraper JS basato sullo scraper Bing
Creazione di scraper JS. Ricezione dei risultati da uno scraper standard
🔗 Scraping di tutti i risultati in Bing
Scraping con sostituzione intelligente delle query tramite il motore di template Template Toolkit e tools.query.add
🔗 Deduplicazione in Bing
Scraping di URL unici per chiave e deduplicazione per dominio, con la possibilità di specificare il numero massimo di URL per singolo dominio
🔗 Più scraper in un preset
Il preset mostra un esempio di utilizzo di più scraper contemporaneamente
Dati raccolti
- Numero di risultati per la query
- Link, anchor e snippet dai risultati
- Elenco di parole chiave correlate (Related keywords)
- Link, link visibili, anchor, snippet e posizione degli annunci dai risultati pubblicitari

Funzionalità
- Supporto per tutti gli operatori di ricerca Bing (site:, ip:, ecc.). Maggiori dettagli sugli operatori di ricerca sulla pagina ufficiale Advanced search keywords.
- Esegue lo scraping del numero massimo di risultati forniti da Bing - fino a 200 pagine di risultati
- Può eseguire automaticamente lo scraping di più di 1000 risultati per query - aggiungendo caratteri supplementari (opzione Parse all results)
- Possibilità di scraping in profondità tramite parole chiave correlate (Parse related to level)
- Possibilità di cercare parole chiave correlate
- Possibilità di estrarre link alle pagine in cache
- Possibilità di estrarre i risultati mobile
- Supporto per il caricamento dei dati tramite scorrimento nella versione mobile
Sulla base dello scraper Bing funzionano i seguenti scraper:
SE::Bing::Position - determinazione delle posizioni di qualsiasi sito nei risultati di ricerca in base a un elenco di query
Casi d'uso
- Raccolta di database di link - per A-Poster, XRumer, AllSubmitter, ecc.
- Valutazione della concorrenza per le keyword
- Ricerca di backlink (menzioni) di siti
- Verifica dell'indicizzazione dei siti
- Ricerca di siti vulnerabili
- Ricerca di siti sullo stesso indirizzo IP
- Qualsiasi altro scenario che implichi lo scraping di Bing in un modo o nell'altro
Query
Come query è necessario indicare frasi di ricerca, esattamente come se venissero inserite direttamente nel modulo di ricerca di Bing, ad esempio:
test
finestre Roma
site:http://lenta.ru
ip:222.36.12.12
Sostituzioni nelle query
Puoi utilizzare i macro integrati per moltiplicare le query, ad esempio se vogliamo ottenere un database molto grande di forum, indichiamo alcune query principali in diverse lingue:
forum
forum
foro
论坛
Nel formato della query indichiamo l'iterazione dei caratteri da a a zzzz, questo metodo permette di ruotare al massimo i risultati di ricerca e ottenere molti nuovi risultati unici:
$query {az:a:zzzz}
Questo macro creerà 475254 query aggiuntive per ogni query di ricerca iniziale, il che darà in totale 4 x 475254 = 1901016 query di ricerca, una cifra impressionante, ma non è affatto un problema per A-Parser. Alla velocità di 2000 query al minuto, tale attività verrà elaborata in sole 16 ore.
Utilizzo degli operatori
Puoi utilizzare gli operatori di ricerca nel formato della query, in questo modo verranno aggiunti automaticamente a ogni query della tua lista:
site:$query
Esempi di output dei risultati
A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON
Esportazione della lista di link
Link + anchor + snippet con output della posizione
Output di link, anchor e snippet in una tabella CSV
Salvataggio delle parole chiave correlate
Concorrenza delle parole chiave
Verifica dell'indicizzazione dei link
Salvataggio in formato SQL
Dump dei risultati in JSON
Elaborazione dei risultati
A-Parser consente di elaborare i risultati direttamente durante lo scraping, in questa sezione abbiamo riportato i casi più popolari per lo scraper Bing
Deduplicazione dei link
Deduplicazione dei link per dominio
Estrazione dei domini
Rimozione dei tag da anchor e snippet
Filtrazione dei link per occorrenza
Impostazioni possibili
| Nome parametro | Valore predefinito | Descrizione |
|---|---|---|
| Pages count | 10 | Numero di pagine da sottoporre a scraping (da 1 a 200) |
| Region | Based on IP | Selezione della regione. Elenco delle regioni. |
| Interface language | Any | Selezione della lingua dell'interfaccia. Elenco delle lingue. |
| Safe Search | Moderate | Selezione dell'opzione di ricerca sicura (Strict / Moderate / Off) |
| Device | Desktop | Selezione del dispositivo di ricerca (Desktop / Mobile) |
| Show inaccessible results | ☐ | Consente di abilitare la visualizzazione dei risultati nascosti |
| Stop pagination by results count | 0 | Interruzione del passaggio sulla paginazione al raggiungimento di un numero specificato di risultati. Funziona in aggiunta a Pages count, lo scraping si ferma a seconda di cosa viene raggiunto prima: il numero specificato di pagine o il numero specificato di risultati. |
| Handle captcha max pages | 10 | Numero massimo di pagine aperte contemporaneamente attraverso le quali vengono generati i cookie necessari per superare con successo il captcha. Limita il parallelismo nella fase di gestione del captcha. |