¿Para qué sirven las actualizaciones y por qué son de pago?
A-Parser constantemente evoluciona. Con el lanzamiento de nuevas versiones se introducen mejoras y correcciones. En este artículo analizaremos en qué consisten las actualizaciones, en qué se diferencian de la licencia, qué papel desempeñan y por qué es necesario pagar por ellas.
Licencia ≠ actualizaciones
Al adquirir A-Parser, usted obtiene una licencia perpetua para su uso y entre 3 y 6 meses de actualizaciones gratuitas dependiendo de la licencia comprada. Una vez finalizado el periodo de actualizaciones gratuitas, puede actualizar a la última versión estable disponible y continuar utilizando el extractor en su totalidad, en la medida en que lo permita la versión disponible al momento de finalizar la suscripción.
Para renovar la suscripción, puede adquirir uno de los tres paquetes de actualizaciones: por 3 meses, un año o de por vida por $49, $149 y $399 respectivamente.
No es necesario pagar por las actualizaciones de forma constante. No hay necesidad de pagar por el periodo en el que no hubo una suscripción activa a las actualizaciones.
¿Por qué las actualizaciones son de pago?
🐞 Correcciones
Los sitios web y diversos tipos de recursos evolucionan con bastante rapidez. Cualquier cambio, incluso el más insignificante por parte del sitio de destino, puede influir en la extracción de datos. Esto ocurre porque inicialmente los extractores están ajustados a una estructura específica, y los cambios en el diseño, la protección u otras mecánicas internas posibles conllevan datos incorrectos en los resultados, su ausencia total y otros errores. La extracción de datos en sí misma afecta negativamente a los servidores dedicados a los sitios: aumentan las solicitudes y, en consecuencia, la carga. Los servicios que pierden beneficios se ven obligados a buscar una salida a esta situación, por lo que aparecen nuevos tipos de protecciones y evolucionan las antiguas.
Con cada uno de estos cambios es necesario realizar ajustes. Detrás de cada uno hay un análisis del problema, la búsqueda de una solución y su implementación.

🧰 Diariamente, cada extractor integrado pasa por un sistema de pruebas internas. Si las solicitudes de prueba finalizan con éxito, se verifican los valores obtenidos en el resultado. Una prueba fallida señala errores presentes en el extractor. Gracias a las pruebas, reaccionamos operativamente a las averías y comenzamos a trabajar de inmediato en su corrección.
Unos de los más complejos, demandados y, por tanto, prioritarios para nosotros son los extractores de los motores de búsqueda Yandex y Google. Cada uno consta de múltiples partes que resuelven una tarea específica. Entre ellas se encuentran la preparación de la consulta, la formación de encabezados, la obtención del código fuente de la página, diversos tipos de formateo de resultados, el trabajo con captcha, etc. Todo esto debe mantenerse en estado operativo. El extractor prevé la presencia de variables que contienen todos los datos necesarios de la página: resultados de búsqueda, anuncios publicitarios, palabras clave relacionadas y otros valores. Estos se extraen mediante expresiones regulares que asumen la presencia de una estructura de documento específica en la página (orden de los elementos, sus tipos, clases y otros atributos posibles). Ante un cambio crítico en esta estructura, la expresión regular que se ajustaba a su versión anterior deja de extraer el fragmento necesario y el extractor se envía a revisión.
✨ Mejoras
Además de mantener la operatividad de los extractores integrados, con cada versión se añaden nuevas funciones y se introducen diversas mejoras que afectan tanto al rendimiento como a la cantidad de datos obtenidos. En la versión se incluyen nuevos extractores y se implementan nuevos métodos en la API de JavaScript.
Puede ver todos los cambios aquí.
Problemas relacionados con la falta de actualizaciones
La falta de actualizaciones oportunas provoca un funcionamiento incorrecto de los extractores integrados. Las razones pueden ser diversas. Por ejemplo, pudo haber cambiado el diseño de las páginas. El extractor, al no haber recibido la actualización, intenta recopilar datos con expresiones regulares antiguas no adaptadas al nuevo formato. Como consecuencia, aparecen solicitudes fallidas, surgen diversos tipos de errores y no hay resultados.
El ejemplo del extractor Google
Un usuario contactó al soporte con el siguiente problema:
Estoy recopilando resultados de Google con sus proxies. He configurado 300 intentos para la consulta. Todas las consultas resultan fallidas. Ayer todo funcionaba.
A primera vista parece que el problema está en los proxies, pero las pruebas con configuraciones y consultas idénticas en la última versión funcionan con éxito. Por lo tanto, el problema es otro. Durante el diálogo se descubre que el usuario tiene una versión desactualizada de A-Parser. Esta es la verdadera causa del funcionamiento incorrecto del extractor Google.
El ejemplo del extractor Yandex
En Yandex cambió el diseño de las páginas con captcha, por lo que dejó de resolverse. En el foro, en la sección de Tareas, se creó el tema correspondiente.

A la mañana siguiente se lanzó un parche. La tarea fue cerrada y trasladada a la sección Next release. Allí se encuentran los temas de todas las correcciones y mejoras que se incluirán en la próxima versión estable.
En consecuencia, en un A-Parser que no recibió la actualización reciente, el captcha en Yandex ya no se resolvía.
Conclusión
Al adquirir A-Parser, usted obtiene una licencia de uso perpetua del programa y un paquete de actualizaciones gratuitas por un periodo determinado. Si es necesario, al vencimiento del plazo de suscripción, puede renovarla adquiriendo uno de los paquetes de actualizaciones propuestos.
Los sitios web son inestables: los extractores requieren constantes ajustes y mejoras. Mantener su estado operativo es nuestro trabajo. Una tarea prioritaria en la que ponemos grandes esfuerzos para lanzar correcciones funcionales con la mayor rapidez posible. El coste de las actualizaciones justifica el trabajo que hay detrás. Cada versión no es solo una lista de correcciones y mejoras, son meses de trabajo concentrado del equipo de A-Parser.