Pular para o conteúdo principal

SE::Yandex::Balaboba - scraper de textos do Balaboba

SE::Yandex::Balaboba

Visão geral do scraper

SE::Yandex::BalabobaSE::Yandex::Balaboba - scraper de textos do Balaboba.

Obtém textos do serviço homônimo.

Você pode usar a multiplicação automática de consultas, substituição de subconsultas de arquivos, busca de combinações alfanuméricas e listas para obter a maior quantidade possível de resultados.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados do scraper SE::Yandex::Balaboba para uso posterior (presets), definir cronogramas de extração de dados e muito mais.

A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso modelo de template integrado Template Toolkit que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Dados coletados

  • Texto gerado
  • Estilo pelo qual o texto foi gerado
  • Link para a imagem

Recursos

  • Extrair textos únicos com a possibilidade de escolher o estilo do texto (parâmetro Style): Receitas (RU), Histórias curtas (RU), Recipies (EN) e outros
  • Escolha do número do estilo que pode ser visto no navegador e extração com o estilo de texto desejado se este não estiver na opção de seleção de estilo (parâmetro ID of custom style)

Casos de uso

  • Coleta em massa de textos únicos

Consultas

Como consultas, é necessário indicar frases com as quais a geração começará, por exemplo:

Era uma vez

Substituições de consultas

Você pode usar macros integradas para substituição automática de subconsultas de arquivos, por exemplo, queremos adicionar a cada consulta alguma lista de outras palavras, indicaremos algumas consultas principais:

Era uma vez
Fantasy
Tower defense

No formato de consultas, indicaremos a macro de substituição de palavras adicionais do arquivo keywords.txt, este método permite aumentar a variabilidade das consultas significativamente:

{subs:keywords} $query 

Esta macro criará tantas consultas adicionais quantas estiverem no arquivo para cada consulta de pesquisa original, o que resultará em [quantidade de consultas originais] x [quantidade de consultas no arquivo Keywords] = [quantidade total de consultas] como resultado da execução da macro.

Por exemplo, se o arquivo keywords.txt contiver:

free
online

No final, a macro de substituições transformará 3 consultas principais em 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Opções de exibição de resultados

O A-Parser suporta formatação flexível de resultados graças ao modelo de template integrado Template Toolkit, o que permite exibir resultados de forma arbitrária, bem como estruturada, por exemplo CSV ou JSON

Exibição padrão

Formato do resultado:

$style: $text\n

Exemplo de resultado:

Sem estilo (RU): Era uma vez três porquinhos, três irmãos.
E cada um deles tinha uma casa.
Eram porquinhos muito unidos.
Eles se ajudavam em tudo e, se algo acontecesse com um deles, o outro irmão sempre vinha em seu auxílio.
Certo dia, caiu uma forte neve e os irmãos decidiram se esconder dela em suas casas.
Mas então, de trás da esquina, apareceu um lobo cinzento.
Ele estava faminto e viu que as casas não tinham portas.
Então o lobo decidiu entrar na primeira casa e comer o porquinho.
O lobo abriu a porta rapidamente e espiou lá dentro.

Configurações possíveis

ParâmetroValor padrãoDescrição
StyleRandom (All languages)Escolha do estilo de texto
ID of custom styleDefinir o número do estilo para a geração de texto
Repeat if Balaboba reports about errorRepetir tentativas de extração de dados se o Balaboba mostrar uma mensagem de erro
Repeat if Balaboba reports about bad queryRepetir tentativas de extração de dados se o Balaboba mostrar uma mensagem devido a uma consulta inválida