Ir al contenido principal

SE::Dogpile - Extractor de resultados de búsqueda de Dogpile

img

Resumen del extractor

Extractor de los resultados de búsqueda de Dogpile. Gracias al extractor SE::Dogpile podrá obtener grandes bases de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Dogpile, incluidos los operadores de búsqueda (url, language, site, etc.).

La funcionalidad de A-Parser permite guardar los ajustes de extracción del extractor Dogpile para su uso posterior (ajustes preestablecidos), establecer un programa de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, el escaneo de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.

Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.

Datos recopilados

  • Enlaces, anclas y fragmentos (snippets) de los resultados
  • Lista de palabras clave relacionadas (Related keywords)
Datos recopilados

Características

  • Extrae el número máximo de resultados entregados por Dogpile: 50 páginas de 10 elementos en los resultados
  • Cantidad total de resultados: 500
  • Posibilidad de buscar palabras clave relacionadas

Casos de uso

  • Recopilación de bases de enlaces: para A-Poster, XRumer, AllSubmitter, etc.
  • Evaluación de la competencia para palabras clave
  • Búsqueda de backlinks (menciones) de sitios
  • Verificación de la indexación de sitios
  • Búsqueda de sitios vulnerables
  • Cualquier otra variante que implique la extracción de datos de Dogpile de una forma u otra

Consultas

Como consultas, debe indicar frases de búsqueda, exactamente igual que si las introdujera directamente en el formulario de búsqueda de Dogpile, por ejemplo:

test
parser language: ru
site: a-parser.com
site: slideshare.net Java Developer gmail.com resume -sample -samples -example -templates

Sustituciones de consultas

Puede utilizar los macros integrados para multiplicar las consultas, por ejemplo, si queremos obtener una base muy grande de foros, indicaremos varias consultas principales en diferentes idiomas:

forum
foro
foro
论坛

En el formato de consultas indicaremos un escaneo de caracteres de a a zzzz, este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:

$query {az:a:zzzz}

Este macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda, una cifra impresionante, pero no es ningún problema para A-Parser. Con una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.

Uso de operadores

Puede utilizar operadores de búsqueda en el formato de la consulta, de modo que se añadirán automáticamente a cada consulta de su lista:

site:$query

Opciones de salida de resultados

A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como en forma estructurada, por ejemplo CSV o JSON

Exportación de lista de enlaces

De forma similar a SE::Google.

De forma similar a SE::Google.

De forma similar a SE::Google.

De forma similar a SE::Google.

Verificación de indexación de enlaces

De forma similar a SE::Google.

Guardar en formato SQL

De forma similar a SE::Google.

Volcado de resultados en JSON

De forma similar a SE::Google.

Procesamiento de resultados

A-Parser permite procesar los resultados directamente durante la extracción de datos, en esta sección presentamos los casos más populares para el extractor Dogpile

De forma similar a SE::Google.

De forma similar a SE::Google.

Extracción de dominios

De forma similar a SE::Google.

Eliminación de etiquetas de anclas y fragmentos

De forma similar a SE::Google.

De forma similar a SE::Google.

Configuraciones posibles

Nombre del parámetroValor por defectoDescripción
Pages count10Cantidad de páginas para extraer (de 1 a 50)
Bypass CloudFlare with ChromeOmisión automática de la verificación de CloudFlare
Bypass CloudFlare with Chrome Max Pages10Cantidad máx. de páginas al omitir CF a través de Chrome
Bypass CloudFlare with Chrome HeadlessSi la opción está activada, el navegador no se mostrará durante la omisión de CF a través de Chrome