SE::Yandex::Balaboba - scraper voor teksten van Balaboba

Overzicht van de scraper
SE::Yandex::Balaboba - scraper voor teksten van Balaboba.Haalt teksten op van de gelijknamige service.
U kunt automatische query-vermenigvuldiging, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen.
De functionaliteit van A-Parser stelt u in staat om de instellingen voor de SE::Yandex::Balaboba scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
- Gegenereerde tekst
- Stijl waarin de tekst is gegenereerd
- Link naar de afbeelding
Mogelijkheden
- Unieke teksten scrapen met de mogelijkheid om een tekststijl te kiezen (parameter Style):
Recepten (RU),Korte verhalen (RU),Recipies (EN)en andere - Het selecteren van een stijlnummer dat in de browser te zien is en scrapen met de gewenste tekststijl als deze niet aanwezig is in de stijlselectie-optie (parameter ID of custom style)
Toepassingen
- Massale verzameling van unieke teksten
Query's
Als query's moeten de zinnen worden opgegeven waarmee de generatie begint, bijvoorbeeld:
Er waren eens
Query-substituties
U kunt ingebouwde macro's gebruiken voor automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld aan elke query een lijst met andere woorden willen toevoegen, geven we enkele basisquery's op:
Er waren eens
Fantasy
Tower defense
In het queryformaat geven we de macro op voor het invoegen van extra woorden uit het bestand keywords.txt. Deze methode stelt u in staat de variatie van query's aanzienlijk te vergroten:
{subs:keywords} $query
Deze macro maakt voor elke oorspronkelijke zoekopdracht evenveel extra query's aan als er in het bestand staan, wat resulteert in [aantal oorspronkelijke query's] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.
Bijvoorbeeld, als het bestand keywords.txt het volgende bevat:
free
online
Uiteindelijk zal de substitutie-macro de 3 basisquery's veranderen in 6:
free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg
Voorbeelden van resultaatweergave
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd, zoals CSV of JSON, kunnen worden uitgevoerd.
Standaard uitvoer
Resultaatformaat:
$style: $text\n
Voorbeeld van resultaat:
Zonder stijl (RU): Er waren eens drie kleine varkentjes, drie broers.
En elk van hen had een huis.
Het waren zeer vriendelijke varkentjes.
Ze hielpen elkaar met alles, en als er iets met een van hen gebeurde, kwam de andere broer altijd te hulp.
Op een dag begon het hard te sneeuwen en de broers besloten te schuilen in hun huizen.
Maar toen kwam er een grijze wolf om de hoek kijken.
Hij had honger en zag dat de huizen geen deuren hadden.
Toen besloot de wolf het eerste huis binnen te gaan en het varkentje op te eten.
De wolf opende snel de deur en keek naar binnen.
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Style | Random (All languages) | Keuze van tekststijl |
| ID of custom style | Stijlnummer instellen voor tekstgeneratie | |
| Repeat if Balaboba reports about error | ☑ | Scrapen opnieuw proberen als Balaboba een foutmelding geeft |
| Repeat if Balaboba reports about bad query | ☑ | Scrapen opnieuw proberen als Balaboba een melding geeft vanwege een ongeldige query |