SE::Yandex::Balaboba - Balaboba metin veri kazıyıcı

Veri kazıyıcı incelemesi
SE::Yandex::Balaboba - Balaboba'dan metin veri kazıyıcı.Aynı adlı servisten metinler alır.
Mümkün olan maksimum sonuç sayısını elde etmek için otomatik sorgu çoğaltma, dosyalardan alt sorgu yerleştirme, harf-sayı kombinasyonlarını ve listeleri tarama özelliklerini kullanabilirsiniz.
A-Parser işlevselliği, SE::Yandex::Balaboba veri kazıyıcı ayarlarını daha sonra kullanmak üzere kaydetmenize (presetler), veri çekme zamanlaması ayarlamanıza ve çok daha fazlasına olanak tanır.
Sonuçların kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda dışa aktarmanıza olanak tanıyan yerleşik güçlü Template Toolkit şablon motoru sayesinde ihtiyacınız olan biçim ve yapıda mümkündür.
Toplanan veriler
- Oluşturulan metin
- Metnin oluşturulduğu stil
- Görsel bağlantısı
Özellikler
- Metin stili seçme imkanı ile benzersiz metinleri çekme (Style parametresi):
Tarifler (RU),Kısa hikayeler (RU),Recipies (EN)ve diğerleri - Tarayıcıda görülebilen stil numarasını seçme ve stil seçme seçeneğinde bulunmayan bir metin stiliyle veri çekme (ID of custom style parametresi)
Kullanım senaryoları
- Toplu benzersiz metin toplama
Sorgular
Sorgu olarak, üretimin başlayacağı ifadeleri belirtmeniz gerekir, örneğin:
Bir varmış bir yokmuş
Sorgu değişimleri
Dosyalardan alt sorguların otomatik olarak yerleştirilmesi için yerleşik makroları kullanabilirsiniz; örneğin, her sorguya başka kelimelerden oluşan bir liste eklemek istiyorsak, birkaç ana sorgu belirtelim:
Bir varmış bir yokmuş
Fantasy
Tower defense
Sorgu formatında, keywords.txt dosyasından ek kelimeler yerleştirme makrosunu belirtelim; bu yöntem sorgu çeşitliliğini kat kat artırmayı sağlar:
{subs:keywords} $query
Bu makro, her bir kaynak arama sorgusu için dosyadaki ek sorgu sayısı kadar sorgu oluşturacaktır; bu da makronun çalışması sonucunda [kaynak sorgu sayısı] x [Keywords dosyasındaki sorgu sayısı] = [toplam sorgu sayısı] elde edilmesini sağlar.
Örneğin, keywords.txt dosyası şunları içeriyorsa:
free
online
Sonuç olarak yerleştirme makrosu 3 ana sorguyu 6 sorguya dönüştürecektir:
free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg
Sonuç çıktı seçenekleri
A-Parser, yerleşik Template Toolkit şablon motoru sayesinde esnek sonuç formatlamayı destekler; bu da sonuçları hem serbest formda hem de CSV veya JSON gibi yapılandırılmış formlarda almanıza olanak tanır.
Varsayılan çıktı
Sonuç formatı:
$style: $text\n
Sonuç örneği:
Stilsiz (RU): Bir varmış bir yokmuş, üç küçük domuzcuk, üç kardeş varmış.
Ve her birinin bir evi varmış.
Bunlar çok dost canlısı domuzcuklarmış.
Her konuda birbirlerine yardım ederlermiş ve eğer birinin başına bir şey gelirse, diğer kardeş her zaman yardıma koşarmış.
Bir gün şiddetli bir kar yağmış ve kardeşler evlerine saklanmaya karar vermişler.
Ama o sırada köşeden gri bir kurt çıkagelmiş.
Kurt çok açmış ve evlerin kapısı olmadığını görmüş.
Bunun üzerine kurt ilk eve girip domuzcuğu yemeye karar vermiş.
Kurt kapıyı hızla açmış ve içeri bakmış.
Olası ayarlar
| Parametre | Varsayılan değer | Açıklama |
|---|---|---|
| Style | Random (All languages) | Metin stili seçimi |
| ID of custom style | Metin üretimi için stil numarasını ayarla | |
| Repeat if Balaboba reports about error | ☑ | Balaboba bir hata mesajı gösterirse veri çekme denemelerini tekrarla |
| Repeat if Balaboba reports about bad query | ☑ | Balaboba geçersiz sorgu nedeniyle bir mesaj gösterirse veri çekme denemelerini tekrarla |