Ga naar de hoofdinhoud

SE::Yandex::Balaboba - scraper voor teksten van Balaboba

SE::Yandex::Balaboba

Overzicht van de scraper

SE::Yandex::BalabobaSE::Yandex::Balaboba - scraper voor teksten van Balaboba.

Haalt teksten op van de gelijknamige service.

U kunt automatische query-vermenigvuldiging, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen.

De functionaliteit van A-Parser stelt u in staat om de instellingen voor de SE::Yandex::Balaboba scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • Gegenereerde tekst
  • Stijl waarin de tekst is gegenereerd
  • Link naar de afbeelding

Mogelijkheden

  • Unieke teksten scrapen met de mogelijkheid om een tekststijl te kiezen (parameter Style): Recepten (RU), Korte verhalen (RU), Recipies (EN) en andere
  • Het selecteren van een stijlnummer dat in de browser te zien is en scrapen met de gewenste tekststijl als deze niet aanwezig is in de stijlselectie-optie (parameter ID of custom style)

Toepassingen

  • Massale verzameling van unieke teksten

Query's

Als query's moeten de zinnen worden opgegeven waarmee de generatie begint, bijvoorbeeld:

Er waren eens

Query-substituties

U kunt ingebouwde macro's gebruiken voor automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld aan elke query een lijst met andere woorden willen toevoegen, geven we enkele basisquery's op:

Er waren eens
Fantasy
Tower defense

In het queryformaat geven we de macro op voor het invoegen van extra woorden uit het bestand keywords.txt. Deze methode stelt u in staat de variatie van query's aanzienlijk te vergroten:

{subs:keywords} $query 

Deze macro maakt voor elke oorspronkelijke zoekopdracht evenveel extra query's aan als er in het bestand staan, wat resulteert in [aantal oorspronkelijke query's] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.

Bijvoorbeeld, als het bestand keywords.txt het volgende bevat:

free
online

Uiteindelijk zal de substitutie-macro de 3 basisquery's veranderen in 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Voorbeelden van resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd, zoals CSV of JSON, kunnen worden uitgevoerd.

Standaard uitvoer

Resultaatformaat:

$style: $text\n

Voorbeeld van resultaat:

Zonder stijl (RU): Er waren eens drie kleine varkentjes, drie broers.
En elk van hen had een huis.
Het waren zeer vriendelijke varkentjes.
Ze hielpen elkaar met alles, en als er iets met een van hen gebeurde, kwam de andere broer altijd te hulp.
Op een dag begon het hard te sneeuwen en de broers besloten te schuilen in hun huizen.
Maar toen kwam er een grijze wolf om de hoek kijken.
Hij had honger en zag dat de huizen geen deuren hadden.
Toen besloot de wolf het eerste huis binnen te gaan en het varkentje op te eten.
De wolf opende snel de deur en keek naar binnen.

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
StyleRandom (All languages)Keuze van tekststijl
ID of custom styleStijlnummer instellen voor tekstgeneratie
Repeat if Balaboba reports about errorScrapen opnieuw proberen als Balaboba een foutmelding geeft
Repeat if Balaboba reports about bad queryScrapen opnieuw proberen als Balaboba een melding geeft vanwege een ongeldige query