Shop::Yandex::Market - Extractor de productos de Yandex.Market

Descripción del extractor
Utilizando el extractor de productos Yandex market, puede obtener datos de la ficha del producto, recopilar una base de enlaces a productos, realizar un seguimiento de la dinámica de precios de los productos, cambios en el número de vendedores, recopilar calificaciones y el número de reseñas de productos, y recopilar imágenes de productos.
La funcionalidad de A-Parser permite guardar la configuración de extracción de datos para su uso posterior (ajustes preestablecidos), establecer programas de extracción de datos y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
Datos recopilados

- Nombre del producto
- Enlace al producto
- Imagen del producto
- Precio y precio anterior
- Moneda
- Calificación y número de comentarios
- Número de vendedores
- Información adicional
- Número de compras y vistas del producto
Variantes de uso
- Recopilación de enlaces a productos
- Evaluación de la popularidad de los productos
- Seguimiento de la dinámica de precios y popularidad de los productos
Consultas
Como consultas, es necesario especificar palabras clave o un enlace a una categoría, por ejemplo:
xiaomi redmi note
https://market.yandex.ru/catalog/54726/list?local-offers-first=0&deliveryincluded=0&onstock=1ы
Variantes de salida de resultados
A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como en forma estructurada, por ejemplo CSV o JSON.
Salida de nombre, precio mínimo y calificación del producto
Formato del resultado:
$products.format('Nombre: $title, Precio mínimo: $amountfrom, Calificación: $rating\n')
Ejemplo de resultado:
Nombre: Smartphone Apple iPhone 11 64GB, Precio mínimo: 46 244, Calificación: 4.7
Nombre: Smartphone Apple iPhone Xr 64GB, Precio mínimo: 36 990, Calificación: 4.7
Nombre: Smartphone Apple iPhone 12 64GB, Precio mínimo: 60 840, Calificación: 4.7
Nombre: Smartphone Apple iPhone SE 2020 64GB, Precio mínimo: 33 490, Calificación: 4.5
Nombre: Smartphone Apple iPhone Xr 128GB, Precio mínimo: 43 450, Calificación: 4.7
Salida en tabla CSV
Formato del resultado:
[% FOREACH item IN products;
tools.CSVline(item.cardlink, item.title, item.amountfrom, item.rating, item.commentscount);
END %]
Ejemplo de resultado:
https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206538929466307988916001&context=search&text=iphone&sku=101106266737,"Smartphone Apple iPhone 11 64GB","46 244",4.7,810
https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206538929466307988916002&context=search&text=iphone&sku=101103379766,"Smartphone Apple iPhone Xr 64GB","36 990",4.7,624
https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206538929466307988916003&context=search&text=iphone&sku=101077347750,"Smartphone Apple iPhone 12 64GB","60 840",4.7,103
https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206538929466307988916004&context=search&text=iphone&sku=101099789863,"Smartphone Apple iPhone SE 2020 64GB","33 490",4.5,358
Texto inicial:
Enlace al producto, Nombre del producto, Precio mínimo, Calificación, Número de comentarios
En el Formato de resultados se aplica el motor de plantillas Template Toolkit para mostrar el array $products en un ciclo FOREACH.
Para que la opción "Texto inicial" esté disponible en el Editor de tareas, debe activar "Más opciones". En "Texto inicial" escribimos los nombres de las columnas separados por comas y dejamos la segunda línea vacía.
Guardado en formato SQL
Formato del resultado:
[% FOREACH item IN products;
"INSERT INTO products VALUES('" _ item.title _ "', '"; item.cardlink _ "', '"; item.amountfrom _ "', '"; item.rating _ "')\n";
END %]
Ejemplo de resultado:
INSERT INTO products VALUES('Smartphone Apple iPhone 11 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206542754162480526716001&context=search&text=iphone&sku=101106266737', '46 244', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone Xr 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206542754162480526716002&context=search&text=iphone&sku=101103379766', '36 990', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone 12 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206542754162480526716003&context=search&text=iphone&sku=101077347750', '60 840', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone SE 2020 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206542754162480526716004&context=search&text=iphone&sku=101099789863', '33 490', '4.5')
Volcado de resultados en JSON
Formato general del resultado:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.items = [];
FOREACH item IN p1.products;
obj.items.push({
link = item.cardlink
name = item.title
amountfrom = item.amountfrom
});
END;
obj.json %]
Texto inicial:
[
Texto final:
]
Ejemplo de resultado:
[
{
"query": "https://market.yandex.ru/catalog--mobilnye-telefony/54726/list?text=iphone&hid=91491&was_redir=1&rt=10&cpa=0&onstock=0&local-offers-first=0",
"items": [
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206548825917275667016001&context=search&text=iphone&sku=101106266737",
"amountfrom": "46 244",
"name": "Smartphone Apple iPhone 11 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206548825917275667016002&context=search&text=iphone&sku=101103379766",
"amountfrom": "36 990",
"name": "Smartphone Apple iPhone Xr 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206548825917275667016003&context=search&text=iphone&sku=101077347750",
"amountfrom": "60 840",
"name": "Smartphone Apple iPhone 12 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206548825917275667016004&context=search&text=iphone&sku=101099789863",
"amountfrom": "33 490",
"name": "Smartphone Apple iPhone SE 2020 64GB"
}
]
}
]
Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".
Configuraciones posibles
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| AntiGate preset | default | Selección de ajuste preestablecido Util::AntiGate, más detalles sobre la configuración aquí |
| AntiGate preset for old captcha | default | Similar a AntiGate preset, pero se utiliza solo para captchas convencionales (antiguos, en forma de una sola imagen). Si no se selecciona un ajuste preestablecido aquí, se utilizará el ajuste preestablecido seleccionado en AntiGate preset para tales captchas. |
| Auto-Solve ClickCaptcha | ☐ | Resolución automática de click captcha (sin utilizar servicios) |
| Experimental img captcha max count | 1 | Número máximo de imágenes de captcha repetidas por intento |
| Pages count | 5 | Número de páginas para extraer datos |
| Search region ID | Not set | Región para la extracción de datos |
