Vai al contenuto principale

Informazioni generali

A-Parser - lo scraper per i professionisti

Example of Task Editor configuration

A-Parser è uno scraper multithreading per motori di ricerca, servizi di valutazione dei siti, parole chiave, contenuti (testo, link, dati arbitrari) e vari altri servizi (YouTube, immagini, traduttore...), A-Parser contiene oltre 90 scraper integrati.

img

Le caratteristiche chiave di A-Parser sono il supporto per le piattaforme Windows/Linux, un'interfaccia web con possibilità di accesso remoto, la possibilità di creare i propri scraper senza scrivere codice, nonché la possibilità di creare scraper con logica complessa in linguaggio JavaScript / TypeScript con supporto per i moduli NodeJS.

Le prestazioni, la gestione dei proxy, il bypass della protezione CloudFlare, un motore HTTP veloce, il supporto per il controllo di Chrome tramite puppeteer, la gestione dello scraper tramite API e molto altro rendono A-Parser una soluzione unica; in questa documentazione cercheremo di illustrare tutti i vantaggi di A-Parser e le sue modalità di utilizzo.


Casi d'uso

A-Parser è in grado di risolvere molti compiti, per comodità li abbiamo suddivisi in categorie in base alle aree di applicazione, segui i link sottostanti per i dettagli

Integrazioni AI

Specialisti SEO e agenzie

Business e freelance

Per sviluppatori

Marketer e analisti

Per e-commerce

Affiliati

Funzionalità e vantaggi

In questa sezione abbiamo elencato brevemente i principali vantaggi di A-Parser, informazioni più dettagliate possono essere trovate al link sottostante

Panoramica di tutte le funzionalità

⏩ Webinar su A-Parser: panoramica e risposte alle domande

Multithreading e prestazioni

  • A-Parser funziona sulla base delle ultime versioni di NodeJS e del motore JavaScript V8
  • AsyncHTTPX - implementazione proprietaria del motore HTTP con supporto per HTTP/1.1 e HTTP/2, HTTPS/TLS, supporto proxy HTTP/SOCKS4/SOCKS5 con autenticazione opzionale
  • Lo scraper è in grado di eseguire richieste HTTP in un numero quasi illimitato di thread simultanei a seconda della configurazione del computer e del compito da svolgere
  • Ogni attività (insieme di query) viene elaborata nel numero specificato di thread
  • Quando si utilizzano più scraper in un'unica attività, ogni richiesta a scraper diversi viene eseguita in thread diversi contemporaneamente
  • Lo scraper è in grado di avviare più attività in parallelo
  • La verifica e il caricamento dei proxy dalle sorgenti avviene anch'essa in modalità multithreading

Creazione di scraper personalizzati

Creazione di scraper in linguaggio JavaScript

Potenti strumenti per la formattazione di query e risultati

  • Costruttore di query e di risultati - consente di modificare i dati (cerca e sostituisci, estrazione del dominio dal link, conversioni tramite espressioni regolari, XPath...)
  • Sostituzioni per le query - da file; iterazione di parole, caratteri e numeri, anche con un passo specificato
  • Filtrazione dei risultati - per occorrenza di sottostringa, uguaglianza, maggiore\minore
  • Deduplicazione dei risultati - per riga, per dominio, per dominio principale (A-Parser conosce tutti i domini di primo livello, inclusi quelli come co.uk, msk.ru)
  • Potente motore di modelli per i risultati basato su Template Toolkit - consente di salvare i risultati in qualsiasi formato comodo (testo, csv, html, xml, formato personalizzato)
  • Lo scraper utilizza un sistema di preset - per ogni scraper è possibile creare molte impostazioni predefinite per diverse situazioni
  • Tutto è configurabile - nessun limite o restrizione
  • L'esportazione e l'importazione delle impostazioni consente di condividere facilmente l'esperienza con altri utenti

API

  • Possibilità di integrare e controllare lo scraper dai propri programmi e script
  • Automazione completa dei processi aziendali
  • Client per PHP, NodeJs, Perl e Python