SE::Bing - Extractor de resultados de búsqueda de Bing

Resumen del extractor
Extractor de resultados de búsqueda de Bing. Gracias al extractor SE::Bing, podrá obtener enormes bases de datos de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Bing, incluidos los operadores de búsqueda (contains, intitle, language, site, etc.). Más detalles en la página oficial Advanced search keywords.
La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Bing para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la generación de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Casos de uso del extractor
🔗 Extracción de datos de resultados de búsqueda de Bing
Extracción de datos de Bing con multiplicación automática de consultas (Parse all results)
🔗 Extracción de datos del top 10 y contenido de etiquetas
Extracción de datos multinivel. Extraemos el top 10 y el contenido de las etiquetas title y description para estos sitios
🔗 Extractor JS basado en el extractor Bing
Creación de extractores JS. Obtención de resultados de un extractor estándar
🔗 Extracción de todos los resultados en Bing
Extracción de datos con sustitución inteligente de consultas a través del motor de plantillas Template Toolkit y tools.query.add
🔗 Unicalización en Bing
Extracción de URLs únicas por palabra clave y unicalización por dominio, con la posibilidad de especificar el número máximo de URLs por dominio
🔗 Varios extractores en un ajuste preestablecido
En el ajuste preestablecido se muestra un ejemplo de uso de varios extractores
Datos recopilados
- Número de resultados por consulta
- Enlaces, anclas y fragmentos (snippets) de los resultados
- Lista de palabras clave relacionadas (Related keywords)
- Enlaces, enlaces visibles, anclas, fragmentos y posición de anuncios de los resultados publicitarios

Capacidades
- Soporte para todos los operadores de búsqueda de Bing (site:, ip:, etc.). Más detalles sobre los operadores de búsqueda en la página oficial Advanced search keywords.
- Extrae el número máximo de resultados proporcionados por Bing: hasta 200 páginas de resultados.
- Puede extraer automáticamente más de 1000 resultados por consulta: añade caracteres adicionales (opción Parse all results).
- Posibilidad de extraer en profundidad por palabras clave relacionadas (Parse related to level).
- Posibilidad de buscar palabras clave relacionadas.
- Posibilidad de extraer enlaces a páginas en caché.
- Posibilidad de extraer resultados móviles.
- Soporte para la carga de datos al hacer scroll en el diseño móvil.
Basados en el extractor Bing, funcionan los siguientes extractores:
SE::Bing::Position - determinación de posiciones de cualquier sitio en los resultados de búsqueda según una lista de consultas
Casos de uso
- Recopilación de bases de enlaces para A-Poster, XRumer, AllSubmitter, etc.
- Evaluación de la competencia para palabras clave.
- Búsqueda de backlinks (menciones) de sitios web.
- Verificación de la indexación de sitios web.
- Búsqueda de sitios web vulnerables.
- Búsqueda de sitios web en una misma dirección IP.
- Cualquier otro caso que implique la extracción de datos de Bing de una forma u otra.
Consultas
Como consultas, se deben indicar frases de búsqueda, exactamente igual que si se introdujeran directamente en el formulario de búsqueda de Bing, por ejemplo:
test
ventanas Madrid
site:http://lenta.ru
ip:222.36.12.12
Sustituciones de consultas
Puede utilizar macros integradas para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos muy grande de foros, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta indicaremos una iteración de caracteres de a a zzzz, este método permite rotar al máximo los resultados de búsqueda y obtener multitud de nuevos resultados únicos:
$query {az:a:zzzz}
Esta macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda; una cifra impresionante, pero no es ningún problema para A-Parser. A una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
site:$query
Ejemplos de salida de resultados
A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo, CSV o JSON.
Exportación de lista de enlaces
Enlaces + anclas + fragmentos con posición
Salida de enlaces, anclas y fragmentos en tabla CSV
Guardar palabras clave relacionadas
Competencia de palabras clave
Verificación de indexación de enlaces
Guardar en formato SQL
Volcado de resultados a JSON
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción de datos; en esta sección presentamos los casos más populares para el extractor Bing.
Desduplicación de enlaces
Desduplicación de enlaces por dominio
Extracción de dominios
Eliminación de etiquetas de anclas y fragmentos
Filtrado de enlaces por inclusión
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 10 | Cantidad de páginas para extraer (de 1 a 200) |
| Region | Based on IP | Selección de región. Lista de regiones. |
| Interface language | Any | Selección del idioma de la interfaz. Lista de idiomas. |
| Safe Search | Moderate | Selección de la opción de búsqueda segura (Strict / Moderate / Off) |
| Device | Desktop | Selección del dispositivo de búsqueda (Desktop / Mobile) |
| Show inaccessible results | ☐ | Permite activar la visualización de resultados ocultos |
| Stop pagination by results count | 0 | Detiene el recorrido por la paginación al alcanzar una cantidad determinada de resultados. Funciona de forma complementaria a Pages count, la extracción se detiene según lo que se alcance primero: la cantidad de páginas o la cantidad de resultados establecida. |