SE::Baidu - Extractor de resultados de búsqueda de Baidu

Descripción general del extractor
Extractor de resultados de búsqueda de Baidu. Gracias al extractor de Baidu, podrá obtener enormes bases de datos de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Bing, incluidos los operadores de búsqueda (filetype, site, intitle).
La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Baidu para su uso futuro (ajustes preestablecidos), establecer programas de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
En el extractor de Baidu, es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Casos de uso del extractor
🔗 Extracción de datos de enlaces completos de Baidu
Este recurso muestra cómo se pueden extraer enlaces completos
🔗 Sugerencias de Baidu
Extracción de datos multinivel de sugerencias de Baidu
🔗 Extractor JS JS::SE::Baidu::Suggest
Creación de extractores JS. Obtención de sugerencias de Baidu
Datos recopilados
- Enlaces
- Fragmentos (snippets)
- Anclas (anchors)
- Número total de resultados
- Lista de palabras relacionadas
- Número de páginas de resultados

Características
- Extrae hasta 5000 resultados por consulta
- Soporte para todos los operadores de búsqueda de Baidu (filetype:, site:, intitle:).
- Recopila resultados por consulta y palabras clave relacionadas
- Conversión de enlaces acortados a enlaces completos (opción Get full links)
Casos de uso
- Recopilación de bases de enlaces para A-Poster, XRumer, AllSubmitter, etc.
- Evaluación de la competencia para palabras clave
- Verificación de la indexación de sitios
- Recopilación de páginas que contienen palabras clave específicas en el título de la página
Consultas
Como consultas, debe especificar frases de búsqueda, por ejemplo:
test
site:www.baidu.com
百度产品大全
intitle:extractor
Sustituciones de consultas
Puede utilizar los macros integrados para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos muy grande de foros, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta, especificaremos una iteración de caracteres de a a zzzz, este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Este macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda, una cifra impresionante, pero que no supone ningún problema para A-Parser. A una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
site:$query
Ejemplos de salida de resultados
A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en cualquier forma, así como en formatos estructurados como CSV o JSON.
Exportación de lista de enlaces
Enlaces + anclas + fragmentos con posición
Salida de enlaces, anclas y fragmentos en tabla CSV
Guardar palabras clave relacionadas
Competencia de palabras clave
Verificación de indexación de enlaces
Guardar en formato SQL
Volcado de resultados a JSON
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción de datos; en esta sección presentamos los casos más populares para el extractor Baidu.
Desduplicación de enlaces
Desduplicación de enlaces por dominio
Extracción de dominios
Eliminación de etiquetas de anclas y fragmentos
Filtrado de enlaces por inclusión
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 5 | Cantidad de páginas a extraer (de 1 a 100) |
| Links per page | 50 | Cantidad de enlaces en los resultados por cada página (10 / 20 / 50) |
| Get full links | ☐ | Conversión de enlaces acortados a enlaces completos (desactivado por defecto) |