SE::Yandex::Balaboba - scraper de textos do Balaboba

Visão geral do scraper
SE::Yandex::Balaboba - scraper de textos do Balaboba.Obtém textos do serviço homônimo.
Você pode usar a multiplicação automática de consultas, substituição de subconsultas de arquivos, busca de combinações alfanuméricas e listas para obter a maior quantidade possível de resultados.
A funcionalidade do A-Parser permite salvar as configurações de extração de dados do scraper SE::Yandex::Balaboba para uso posterior (presets), definir cronogramas de extração de dados e muito mais.
A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso modelo de template integrado Template Toolkit que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.
Dados coletados
- Texto gerado
- Estilo pelo qual o texto foi gerado
- Link para a imagem
Recursos
- Extrair textos únicos com a possibilidade de escolher o estilo do texto (parâmetro Style):
Receitas (RU),Histórias curtas (RU),Recipies (EN)e outros - Escolha do número do estilo que pode ser visto no navegador e extração com o estilo de texto desejado se este não estiver na opção de seleção de estilo (parâmetro ID of custom style)
Casos de uso
- Coleta em massa de textos únicos
Consultas
Como consultas, é necessário indicar frases com as quais a geração começará, por exemplo:
Era uma vez
Substituições de consultas
Você pode usar macros integradas para substituição automática de subconsultas de arquivos, por exemplo, queremos adicionar a cada consulta alguma lista de outras palavras, indicaremos algumas consultas principais:
Era uma vez
Fantasy
Tower defense
No formato de consultas, indicaremos a macro de substituição de palavras adicionais do arquivo keywords.txt, este método permite aumentar a variabilidade das consultas significativamente:
{subs:keywords} $query
Esta macro criará tantas consultas adicionais quantas estiverem no arquivo para cada consulta de pesquisa original, o que resultará em [quantidade de consultas originais] x [quantidade de consultas no arquivo Keywords] = [quantidade total de consultas] como resultado da execução da macro.
Por exemplo, se o arquivo keywords.txt contiver:
free
online
No final, a macro de substituições transformará 3 consultas principais em 6:
free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg
Opções de exibição de resultados
O A-Parser suporta formatação flexível de resultados graças ao modelo de template integrado Template Toolkit, o que permite exibir resultados de forma arbitrária, bem como estruturada, por exemplo CSV ou JSON
Exibição padrão
Formato do resultado:
$style: $text\n
Exemplo de resultado:
Sem estilo (RU): Era uma vez três porquinhos, três irmãos.
E cada um deles tinha uma casa.
Eram porquinhos muito unidos.
Eles se ajudavam em tudo e, se algo acontecesse com um deles, o outro irmão sempre vinha em seu auxílio.
Certo dia, caiu uma forte neve e os irmãos decidiram se esconder dela em suas casas.
Mas então, de trás da esquina, apareceu um lobo cinzento.
Ele estava faminto e viu que as casas não tinham portas.
Então o lobo decidiu entrar na primeira casa e comer o porquinho.
O lobo abriu a porta rapidamente e espiou lá dentro.
Configurações possíveis
| Parâmetro | Valor padrão | Descrição |
|---|---|---|
| Style | Random (All languages) | Escolha do estilo de texto |
| ID of custom style | Definir o número do estilo para a geração de texto | |
| Repeat if Balaboba reports about error | ☑ | Repetir tentativas de extração de dados se o Balaboba mostrar uma mensagem de erro |
| Repeat if Balaboba reports about bad query | ☑ | Repetir tentativas de extração de dados se o Balaboba mostrar uma mensagem devido a uma consulta inválida |