SE::Seznam - Extractor del motor de búsqueda checo seznam.cz

Descripción general del extractor
Extractor de resultados de búsqueda de Seznam. Gracias al extractor Seznam, podrá obtener grandes bases de datos de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Dogpile, incluyendo los operadores de búsqueda (site, inurl, etc.).
La funcionalidad de A-Parser permite guardar los ajustes de extracción del extractor Seznam para su uso posterior (ajustes preestablecidos), establecer un programa de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la generación de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
El guardado de resultados es posible en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluyendo JSON, SQL y CSV.
Datos recopilados
- Enlaces, anclas y fragmentos (snippets) de los resultados
- Lista de palabras clave relacionadas (Related keywords)

Capacidades
- Extrae el número máximo de resultados entregados por Seznam: 50 páginas de 20 elementos por búsqueda
- Cantidad máxima total de resultados por consulta: 1000
Variantes de uso
- Recopilación de bases de enlaces para A-Poster, XRumer, AllSubmitter, etc.
- Búsqueda de backlinks (menciones) de sitios web
- Búsqueda de sitios vulnerables
- Cualquier otra variante que implique la extracción de datos de Seznam de una forma u otra
Consultas
Como consultas, es necesario indicar frases de búsqueda, exactamente igual que si se introdujeran directamente en el formulario de búsqueda de Seznam, por ejemplo:
test query
ventanas Madrid
site:a-parser.com
inurl:auto
Sustituciones de consultas
Puede utilizar los macros integrados para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos muy grande de foros, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta indicaremos una iteración de caracteres de a a zzzz, este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Este macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda; una cifra impresionante, pero no es ningún problema para A-Parser. Con una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
site:$query
Variantes de salida de resultados
A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON
Exportación de lista de enlaces
Enlaces + anclas + fragmentos con posición
Salida de enlaces, anclas y fragmentos en tabla CSV
Guardado en formato SQL
Volcado de resultados en JSON
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción de datos; en esta sección presentamos los casos más populares para el extractor Seznam
Unicidad de enlaces
Unicidad de enlaces por dominio
Extracción de dominios
Eliminación de etiquetas de anclas y fragmentos
Filtrado de enlaces por inclusión
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 5 | Cantidad de páginas para extraer (de 1 a 50) |
| Links per page | 10 | Cantidad de enlaces en una página (10 / 20) |