Ir al contenido principal

SE::Yandex::SQI - Verificación del Índice de Calidad del Sitio en Yandex

Resumen del extractor

Resumen del extractorSE::Yandex::SQISE::Yandex::SQI – comprobación del índice de calidad del sitio en Yandex. Extractor increíblemente rápido, velocidad de trabajo de 3000-7000 consultas por minuto.

Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, el escaneo de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados. Utilizando el filtrado de resultados puede limpiar inmediatamente el resultado, eliminando toda la basura innecesaria (utilizando palabras negativas).

La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor SE::Yandex::SQI para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.

Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluyendo JSON, SQL y CSV.

Datos recopilados

  • Índice de calidad del sitio (Yandex SQI)
  • Datos sobre la presencia de insignias en el sitio (1 - insignia obtenida, 0 - sin insignia):
    • Elección de los usuarios
    • Sitio popular
    • Conexión segura
    • Páginas Turbo
    • Si el sitio es oficial
  • Para las insignias "Elección de los usuarios" y "Sitio popular", se puede obtener el grado de preparación para recibir la insignia como un valor intermedio de 0 a 1, por ejemplo 0.4.
  • Número de reseñas, valoración y calificación
  • Calificación de la tienda en la búsqueda de productos y calificación de la tienda en Yandex Market (si estos datos están disponibles para el sitio buscado)

Variantes de uso

  • Evaluación de la utilidad del sitio desde el punto de vista de Yandex
  • Recopilación de títulos

Consultas

Como consultas, es necesario indicar el dominio del sitio buscado. Se puede indicar tanto con el protocolo como sin él, por ejemplo:

yandex.ru 
google.com
vk.com
facebook.com
https://a-parser.com

Variantes de salida de resultados

A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON

Salida por defecto

Formato del resultado:

$query: $sqi\n

Ejemplo de resultado, en el que se muestra la consulta inicial y su SQI:

facebook.com: 130000  
yandex.ru: -1
https://a-parser.com: 110
google.com: 120000
vk.com: 340000

Si el SQI para el dominio no está disponible, el resultado será -1.

Salida en tabla CSV

Formato del resultado:

[% tools.CSVline(query, sqi, rating); %]

Nombre del archivo:

$datefile.format().csv

Texto inicial:

Dominio,Calificación,Autor,Precio

sugerencia

Para que la opción "Texto inicial" esté disponible en el Editor de tareas, debe activar "Más opciones". En "Texto inicial" escribimos los nombres de las columnas separados por comas y dejamos la segunda línea vacía.

Guardado en formato SQL

Formato del resultado:

[% "INSERT INTO sqi VALUES('" _ query _ "', '" _ sqi _ "', '" _ rating _ "')\n" %]

Ejemplo de resultado:

INSERT INTO sqi VALUES('google.com', '122000', '87')
INSERT INTO sqi VALUES('yandex.ru', 'none', '92')
INSERT INTO sqi VALUES('https://a-parser.com', '200', '')
INSERT INTO sqi VALUES('vk.com', '326000', '73')
INSERT INTO sqi VALUES('facebook.com', '117000', '66')

Volcado de resultados en JSON

Formato general del resultado:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.sqi = p1.sqi;
obj.rating = p1.rating;

obj.json %]

Texto inicial:

[

Texto final:

]

Ejemplo de resultado:

[{"query":"vk.com","rating":73,"sqi":326000},
{"query":"google.com","rating":87,"sqi":122000},
{"query":"https://a-parser.com","rating":"","sqi":200},
{"query":"yandex.ru","rating":92,"sqi":"none"},
{"query":"facebook.com","rating":66,"sqi":117000}]
sugerencia

Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".

Configuraciones posibles

ParámetroValor por defectoDescripción
AntiGate presetdefaultSelección de ajuste preestablecido Util::AntiGateUtil::AntiGate, más detalles sobre la configuración aquí
AntiGate preset for old captchadefaultDe manera similar a AntiGate preset, pero se utiliza solo para captchas normales (antiguos, en forma de una sola imagen). Si no se selecciona un ajuste preestablecido aquí, se utilizará el ajuste preestablecido seleccionado en AntiGate preset.
Experimental img captcha max count5Número máximo de reintentos de imágenes de captcha por intento
Preffered captcha typeClickSelección del tipo de captcha preferido: Click o Puzzle
Use sessionsGuarda sesiones buenas, lo que permite realizar la extracción de datos aún más rápido, obteniendo un menor número de errores