SE::Rambler - extractor de resultados de búsqueda de Rambler

Descripción general del extractor
Extractor de los resultados de búsqueda de Rambler. Gracias al extractor Rambler, podrá obtener grandes bases de datos de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Rambler, incluidos los operadores de búsqueda (site, ip, etc.).
La funcionalidad de A-Parser permite guardar los ajustes de extracción del extractor Rambler para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Datos recopilados
- Número de resultados en la búsqueda
- Enlaces, anclajes y fragmentos (snippets) de los resultados
- Lista de palabras clave relacionadas (hints)

Características
- Soporte para operadores de búsqueda de Rambler (url:, site:, inurl:, host:, rhost:, domain:.)
- Extrae hasta 25 páginas, de 10 a 50 resultados por página
- Extrae palabras clave relacionadas ($hints)
- Posibilidad de utilizar servicios de resolución para omitir captchas
- Selección del dispositivo de resultados: escritorio convencional, móvil Android o móvil iOS
Casos de uso
- Recopilación de bases de enlaces
- Evaluación de la competencia para palabras clave
- Búsqueda de backlinks (menciones) de sitios
- Todos los casos en los que sea necesario extraer los resultados de búsqueda de Rambler
Consultas
Especifique las consultas de la misma manera que en la búsqueda de Rambler. Por ejemplo, si solo necesita enlaces de un sitio. Introduzca en el campo de consultas:
"comprar puertas" site:http://kp.ru
Sustituciones de consultas
Puede utilizar macros integradas para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos de foros muy grande, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta, indicaremos la iteración de caracteres de a a zzzz; este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Esta macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda, una cifra impresionante, pero que no supone ningún problema para A-Parser. A una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
site:$query
Opciones de salida de resultados
A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo, CSV o JSON
Exportación de una lista de enlaces
Enlaces + anclajes + fragmentos con visualización de posición
Salida de enlaces, anclajes y fragmentos en una tabla CSV
Guardar palabras clave relacionadas
Formato de resultado:
$hints.format('$hint\n')
Ejemplo de resultado:
habrahabr
habr
habrahabr ru
xabra
livebusiness
eureka
contable electrónico
isla elba
elba contable electrónico
habrahabr
...
Guardar en formato SQL
Volcado de resultados en JSON
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción; en esta sección presentamos los casos más populares para el extractor Rambler
Unicidad de enlaces
Unicidad de enlaces por dominio
Extracción de dominios
Eliminación de etiquetas de anclajes y fragmentos
Filtrado de enlaces por inclusión
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Device | Desktop | Selección del dispositivo de resultados: escritorio convencional, móvil Android o móvil iOS |
| Pages count | 5 | Número de páginas a extraer (de 1 a 25) |
| Links per page | 10 | Número de resultados por página (10/15/30/50) |
| Rambler region ID | Posibilidad de definir una región. Se debe indicar el ID de la región. Cómo averiguar el ID de la región deseada se describe aquí | |
| Sort | Sites by relevance | Selección de la opción de ordenación de resultados |
| Results filtering | Moderate | Selección de la opción de filtrado de resultados |
| Results language | Any language | Selección del idioma de búsqueda de resultados |
| Serp time | Anytime | Selección del periodo de los resultados |
| Results type | Any format | Selección del tipo de resultados (mime type) |
| Exact match | ☐ | Coincidencia exacta con la consulta |
| Disable autocorrect | ☐ | Desactiva la autocorrección, permite extraer los resultados exactamente para la consulta especificada |
| Use sessions | ☑ | Guarda sesiones válidas, lo que permite extraer aún más rápido, obteniendo un menor número de errores |
| AntiGate preset | default | Determina si usar Util::AntiGate para omitir captchas |
