Lista de termos
Scraper
Scraper - é um script que coleta dados de recursos da web especificados de acordo com as consultas indicadas, processa-os e exibe o resultado no formato padrão ou especificado.
Scrapers integrados
Scrapers integrados - são scrapers pré-instalados, disponíveis nativamente, cuja funcionalidade é mantida de forma contínua.
Scrapers JS personalizados
Scrapers JS personalizados - são scrapers de código aberto, escritos em JavaScript e disponíveis no Editor de scrapers JS, que podem ser exportados e importados junto com a tarefa. Exemplos desses scrapers podem ser encontrados no Catálogo de scrapers e presets.
Preset
Preset - é tanto uma tarefa salva, que é criada no Editor de tarefas selecionando um conjunto de scrapers, configurações e opções para realizar uma tarefa, quanto as configurações de um scraper individual (preset de configurações).
Configurações do scraper
Configurações do scraper - são opções que podem ser editadas ou alteradas (sobrescritas) para um algoritmo diferente de operação do scraper a fim de obter um resultado não padrão.
Tarefa salva
Tarefa salva - é um preset que foi salvo e pode ser reutilizado.
Configuração de threads
Configuração de threads - é um conjunto de configurações de threads que pode ser salvo sob um nome e reutilizado com diferentes presets.
Threads
Threads - é um conjunto de contextos executados simultaneamente para extração de dados, nos quais o scraper executa consultas em paralelo, alterna Proxy de acordo com uma estratégia específica definida na Configuração de threads e registra o processo de execução da extração de dados para cada consulta.
Verificador de Proxy
Verificador de Proxy - é um controlador responsável por carregar e verificar proxies, utilizando um conjunto de configurações do verificador de proxy.
Proxy
Proxy - é uma string/array de strings de um formato específico (ou um link para uma string/array de strings), que permite ocultar o endereço IP real enviando solicitações na extração de dados e transmitindo pacotes de dados do servidor para o cliente por meio de um servidor proxy intermediário.
Modelo de resultado
Modelo de resultado - é um modelo que define o formato e os dados coletados do resultado, definidos diretamente ou usando o mecanismo de modelos integrado Template Toolkit.