Vai al contenuto principale

SE::Yandex::Balaboba - scraper di testi da Balaboba

SE::Yandex::Balaboba

Panoramica dello scraper

SE::Yandex::BalabobaSE::Yandex::Balaboba - scraper di testi da Balaboba.

Ottiene testi dall' omonimo servizio.

È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati.

La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper SE::Yandex::Balaboba per un uso futuro (preset), impostare pianificazioni di scraping e molto altro.

Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.

Dati raccolti

  • Testo generato
  • Stile con cui è stato generato il testo
  • Link all'immagine

Funzionalità

  • Eseguire lo scraping di testi unici con la possibilità di scegliere lo stile del testo (parametro Style): Ricette (RU), Brevi storie (RU), Recipies (EN) e altri
  • Scelta del numero di stile visualizzabile nel browser per eseguire lo scraping con lo stile di testo desiderato se non presente nell'opzione di selezione dello stile (parametro ID of custom style)

Casi d'uso

  • Raccolta massiva di testi unici

Query

Come query è necessario indicare le frasi da cui inizierà la generazione, ad esempio:

C'era una volta

Sostituzioni nelle query

È possibile utilizzare le macro integrate per la sostituzione automatica di sotto-query da file; ad esempio, se vogliamo aggiungere a ogni query una lista di altre parole, indichiamo alcune query di base:

C'era una volta
Fantasy
Tower defense

Nel formato delle query indichiamo la macro di sostituzione di parole aggiuntive dal file keywords.txt; questo metodo consente di aumentare esponenzialmente la variabilità delle query:

{subs:keywords} $query 

Questa macro creerà tante query aggiuntive quante sono presenti nel file per ogni query di ricerca originale, il che risulterà in [numero di query originali] x [numero di query nel file Keywords] = [numero totale di query] come risultato del lavoro della macro.

Ad esempio, se il file keywords.txt contiene:

free
online

Alla fine, la macro di sostituzione trasformerà 3 query principali in 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Esempi di output dei risultati

A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON

Output predefinito

Formato del risultato:

$style: $text\n

Esempio di risultato:

Senza stile (RU): C'erano una volta tre porcellini, tre fratelli.
E ognuno di loro aveva una casa.
Erano porcellini molto uniti.
Si aiutavano a vicenda in tutto, e se succedeva qualcosa a uno di loro, l'altro fratello correva sempre in aiuto.
Un giorno cadde molta neve e i fratelli decisero di nascondersi nelle loro case.
Ma all'improvviso da dietro l'angolo uscì un lupo grigio.
Era affamato e vide che le case non avevano porte.
Allora il lupo decise di entrare nella prima casa e mangiare il porcellino.
Il lupo aprì rapidamente la porta e guardò dentro.

Impostazioni possibili

ParametroValore predefinitoDescrizione
StyleRandom (All languages)Scelta dello stile del testo
ID of custom styleImpostare il numero dello stile per la generazione del testo
Repeat if Balaboba reports about errorRipetere i tentativi di scraping se Balaboba ha mostrato un messaggio di errore
Repeat if Balaboba reports about bad queryRipetere i tentativi di scraping se Balaboba ha mostrato un messaggio a causa di una query errata