Glosario de términos
Extractor
Un extractor es un script que recopila datos de recursos web específicos según las consultas indicadas, los procesa y muestra el resultado en el formato predeterminado o especificado.
Extractores integrados
Los extractores integrados son extractores preinstalados, disponibles desde el inicio, cuya operatividad se mantiene de forma constante.
Extractores JS personalizados
Los extractores JS personalizados son extractores de código abierto, escritos en JavaScript y disponibles en el Editor de extractores JS, que se pueden exportar e importar junto con la tarea. Se pueden encontrar ejemplos de estos extractores en el Catálogo de extractores y ajustes preestablecidos.
Ajuste preestablecido
Un ajuste preestablecido es tanto una tarea guardada, que se crea en el Editor de tareas seleccionando un conjunto de extractores, configuraciones y opciones para realizar una tarea, como la configuración de un extractor individual (ajuste preestablecido de configuración).
Configuraciones del extractor
Las configuraciones del extractor son opciones que pueden ser editadas o modificadas (redefinidas) para un algoritmo de funcionamiento diferente del extractor con el fin de obtener un resultado no estándar.
Tarea guardada
Una tarea guardada es un ajuste preestablecido que ha sido guardado y puede ser reutilizado.
Configuración de hilos
La configuración de hilos es un conjunto de ajustes de hilos que se puede guardar bajo un nombre y reutilizar con diferentes ajustes preestablecidos.
Hilos
Los hilos son múltiples contextos ejecutados simultáneamente para la extracción de datos, en los cuales el extractor realiza consultas en paralelo, recorre los proxy según una estrategia específica definida en la Configuración de hilos y registra el proceso de ejecución de la extracción de datos para cada consulta.
Verificador de proxy
El verificador de proxy es un controlador que se encarga de cargar y verificar los proxies, utilizando un conjunto de configuraciones del verificador de proxy.
Proxy
Un proxy es una cadena/matriz de cadenas de un formato determinado (o un enlace a una cadena/matriz de cadenas), que permite ocultar la dirección IP real mediante el envío de consultas en la extracción de datos y la transferencia de paquetes de datos del servidor al cliente a través de un servidor proxy intermedio.
Plantilla de resultado
La plantilla de resultado es una plantilla que define el formato y los datos recopilados del resultado, establecidos directamente o mediante el motor de plantillas integrado Template Toolkit.