Shop::Yandex::Market - Parser für Produkte von Yandex.Market

Übersicht über den Parser
Mit dem Yandex Market Produkt-Parser können Sie Daten von Produktkarten extrahieren, eine Datenbank mit Produktlinks erstellen, die Preisdynamik überwachen, Änderungen in der Anzahl der Verkäufer verfolgen, Bewertungen und die Anzahl der Rezensionen erfassen sowie Produktbilder sammeln.
Die Funktionalität von A-Parser ermöglicht es Ihnen, Datenerfassungseinstellungen für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr. Sie können die automatische Abfragevervielfachung, die Einsetzung von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen nutzen, um die maximal mögliche Anzahl an Ergebnissen zu erhalten.
Erfasste Daten

- Produktname
- Link zum Produkt
- Produktbild
- Preis und alter Preis
- Währung
- Bewertung und Anzahl der Kommentare
- Anzahl der Verkäufer
- Zusätzliche Informationen
- Anzahl der Käufe und Aufrufe des Produkts
Anwendungsfälle
- Sammeln von Produktlinks
- Bewertung der Produktpopularität
- Überwachung der Preisdynamik und Produktpopularität
Abfragen
Als Abfragen müssen Schlüsselwörter oder ein Link zur Kategorie angegeben werden, zum Beispiel:
xiaomi redmi note
https://market.yandex.ru/catalog/54726/list?local-offers-first=0&deliveryincluded=0&onstock=1ы
Beispiele für die Ergebnisausgabe
A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.
Ausgabe von Name, Mindestpreis und Produktbewertung
Ergebnisformat:
$products.format('Name: $title, Mindestpreis: $amountfrom, Bewertung: $rating\n')
Ergebnisbeispiel:
Name: Smartphone Apple iPhone 11 64GB, Mindestpreis: 46 244, Bewertung: 4.7
Name: Smartphone Apple iPhone Xr 64GB, Mindestpreis: 36 990, Bewertung: 4.7
Name: Smartphone Apple iPhone 12 64GB, Mindestpreis: 60 840, Bewertung: 4.7
Name: Smartphone Apple iPhone SE 2020 64GB, Mindestpreis: 33 490, Bewertung: 4.5
Name: Smartphone Apple iPhone Xr 128GB, Mindestpreis: 43 450, Bewertung: 4.7
Ausgabe in eine CSV-Tabelle
Ergebnisformat:
[% FOREACH item IN products;
tools.CSVline(item.cardlink, item.title, item.amountfrom, item.rating, item.commentscount);
END %]
Ergebnisbeispiel:
https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206538929466307988916001&context=search&text=iphone&sku=101106266737,"Smartphone Apple iPhone 11 64GB","46 244",4.7,810
https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206538929466307988916002&context=search&text=iphone&sku=101103379766,"Smartphone Apple iPhone Xr 64GB","36 990",4.7,624
https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206538929466307988916003&context=search&text=iphone&sku=101077347750,"Smartphone Apple iPhone 12 64GB","60 840",4.7,103
https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206538929466307988916004&context=search&text=iphone&sku=101099789863,"Smartphone Apple iPhone SE 2020 64GB","33 490",4.5,358
Anfangstext:
Produktlink, Produktname, Mindestpreis, Bewertung, Anzahl der Kommentare
Im Ergebnisformat wird die Template Toolkit Template-Engine verwendet, um das Array $products in einer FOREACH-Schleife auszugeben.
Damit die Option "Anfangstext" im Task-Editor verfügbar ist, müssen Sie "Mehr Optionen" aktivieren. In "Anfangstext" schreiben wir die Spaltennamen durch Komma getrennt und lassen die zweite Zeile leer.
Speichern im SQL-Format
Ergebnisformat:
[% FOREACH item IN products;
"INSERT INTO products VALUES('" _ item.title _ "', '"; item.cardlink _ "', '"; item.amountfrom _ "', '"; item.rating _ "')\n";
END %]
Ergebnisbeispiel:
INSERT INTO products VALUES('Smartphone Apple iPhone 11 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206542754162480526716001&context=search&text=iphone&sku=101106266737', '46 244', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone Xr 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206542754162480526716002&context=search&text=iphone&sku=101103379766', '36 990', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone 12 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206542754162480526716003&context=search&text=iphone&sku=101077347750', '60 840', '4.7')
INSERT INTO products VALUES('Smartphone Apple iPhone SE 2020 64GB', 'https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206542754162480526716004&context=search&text=iphone&sku=101099789863', '33 490', '4.5')
Dump der Ergebnisse in JSON
Allgemeines Ausgabeformat:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.items = [];
FOREACH item IN p1.products;
obj.items.push({
link = item.cardlink
name = item.title
amountfrom = item.amountfrom
});
END;
obj.json %]
Anfangstext:
[
Endtext:
]
Ergebnisbeispiel:
[
{
"query": "https://market.yandex.ru/catalog--mobilnye-telefony/54726/list?text=iphone&hid=91491&was_redir=1&rt=10&cpa=0&onstock=0&local-offers-first=0",
"items": [
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-11-64gb/558171067?nid=54726&show-uid=16206548825917275667016001&context=search&text=iphone&sku=101106266737",
"amountfrom": "46 244",
"name": "Smartphone Apple iPhone 11 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-xr-64gb/175941311?nid=54726&show-uid=16206548825917275667016002&context=search&text=iphone&sku=101103379766",
"amountfrom": "36 990",
"name": "Smartphone Apple iPhone Xr 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-12-64gb/722976004?nid=54726&show-uid=16206548825917275667016003&context=search&text=iphone&sku=101077347750",
"amountfrom": "60 840",
"name": "Smartphone Apple iPhone 12 64GB"
},
{
"link": "https://market.yandex.ru/product--smartfon-apple-iphone-se-2020-64gb/661221015?nid=54726&show-uid=16206548825917275667016004&context=search&text=iphone&sku=101099789863",
"amountfrom": "33 490",
"name": "Smartphone Apple iPhone SE 2020 64GB"
}
]
}
]
Damit die Optionen "Anfangstext" und "Endtext" im Task-Editor verfügbar sind, müssen Sie "Mehr Optionen" aktivieren.
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| AntiGate preset | default | Auswahl des Presets Util::AntiGate, Details zur Einstellung hier |
| AntiGate preset for old captcha | default | Ähnlich wie AntiGate preset, wird aber nur für gewöhnliche (alte, als einzelnes Bild vorliegende) Captchas verwendet. Wenn hier kein Preset ausgewählt ist, wird für solche Captchas das in AntiGate preset gewählte Preset verwendet. |
| Auto-Solve ClickCaptcha | ☐ | Automatisches Lösen von Click-Captchas (ohne Verwendung von Diensten) |
| Experimental img captcha max count | 1 | Maximale Anzahl wiederholter Captcha-Bilder pro Versuch |
| Pages count | 5 | Anzahl der zu scrapenden Seiten |
| Search region ID | Not set | Region für die Datenerfassung |
