Información general
A-Parser - el extractor para profesionales

A-Parser - extractor multihilo de motores de búsqueda, servicios de evaluación de sitios, palabras clave, contenido (texto, enlaces, datos arbitrarios) y otros servicios diversos (youtube, imágenes, traductor...), A-Parser contiene más de 90 extractores integrados.

Las características clave de A-Parser son el soporte para plataformas Windows/Linux, interfaz web con posibilidad de acceso remoto, la posibilidad de crear sus propios extractores sin escribir código, así como la posibilidad de crear extractores con lógica compleja en el lenguaje JavaScript / TypeScript con soporte para módulos NodeJS.
El rendimiento, el trabajo con proxy, la elusión de la protección de CloudFlare, un motor HTTP rápido, el soporte para el control de Chrome a través de puppeteer, el control del extractor por API y mucho más hacen de A-Parser una solución única; en esta documentación intentaremos revelar todas las ventajas de A-Parser y las formas de utilizarlo.
Áreas de uso
A-Parser es capaz de resolver multitud de tareas; para mayor comodidad, las hemos dividido en categorías por áreas de aplicación, siga los enlaces a continuación para obtener más detalles
Integraciones con IA
Especialistas y estudios SEO
Para empresas y autónomos
Para desarrolladores
Profesionales del marketing
Comercio electrónico
Afiliados
Características y ventajas
En esta sección hemos enumerado brevemente las principales ventajas de A-Parser, puede encontrar información más detallada en el siguiente enlace
Resumen de todas las funciones
⏩ Seminario web sobre A-Parser: descripción general y respuestas a preguntas
Multihilo y rendimiento
- A-Parser funciona sobre la base de las últimas versiones de NodeJS y el motor JavaScript V8
- AsyncHTTPX: implementación propia del motor HTTP con soporte para HTTP/1.1 y HTTP/2, HTTPS/TLS, soporte para proxy HTTP/SOCKS4/SOCKS5 con autorización opcional
- El extractor es capaz de realizar solicitudes HTTP en un número casi ilimitado de hilos simultáneos dependiendo de la configuración de la computadora y la tarea a resolver
- Cada tarea (conjunto de consultas) se extrae en el número especificado de hilos
- Al usar varios extractores en una sola tarea, cada solicitud a diferentes extractores se realiza en diferentes hilos simultáneamente
- El extractor puede ejecutar varias tareas en paralelo
- La comprobación y carga de proxies desde fuentes también se realiza en modo multihilo
Creación de extractores propios
- Posibilidad de crear extractores sin escribir código
- Uso de expresiones regulares
- Soporte para extracción de datos multipágina
- Comprobación de contenido y presencia de la página siguiente
- Sustitución de user-agent y posibilidad de cambiarlo aleatoriamente en cada solicitud
- Extracción anidada: posibilidad de insertar los resultados obtenidos en las consultas
- Trabajo completo con JSON: análisis y formación
- Posibilidad de añadir sus propias funciones JS y utilizarlas para procesar los resultados obtenidos directamente en el extractor
Creación de extractores en lenguaje JavaScript
- Rica API integrada basada en async/await
- Soporte para TypeScript
- Posibilidad de conectar cualquier módulo NodeJS
- Control de Chrome/Chromium a través de puppeteer con soporte para proxies separados para cada pestaña
Potentes herramientas para la formación de consultas y resultados
- Constructor de consultas y de resultados: permite modificar los datos (buscar y reemplazar, extraer dominio de un enlace, transformaciones por expresiones regulares, XPath...)
- Sustituciones para consultas: desde archivo; iteración de palabras, caracteres y números, incluso con un paso determinado
- Filtrado de resultados: por coincidencia de subcadena, igualdad, mayor/menor que
- Deduplicación de resultados: por cadena, por dominio, por dominio principal (A-Parser conoce todos los dominios de nivel superior, incluidos co.uk, msk.ru)
- Potente motor de plantillas de resultados basado en Template Toolkit: permite mostrar los resultados en cualquier formato conveniente (texto, csv, html, xml, formato personalizado)
- El extractor utiliza un sistema de ajustes preestablecidos: para cada extractor se pueden crear múltiples ajustes preestablecidos de configuración para diversas situaciones
- Se puede configurar todo: sin límites ni restricciones
- La exportación e importación de configuraciones permite compartir fácilmente la experiencia con otros usuarios