SE::Yandex::SQI - Überprüfung des Website-Qualitätsindex (SQI) bei Yandex
Übersicht des Parsers

SE::Yandex::SQI – Überprüfung des Website-Qualitätsindex (SQI) bei Yandex. Unglaublich schneller Parser, Arbeitsgeschwindigkeit 3000-7000 Abfragen pro Minute.Sie können die automatische Abfragevervielfältigung, die Substitution von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten. Durch die Verwendung der Ergebnisfilterung können Sie das Ergebnis sofort bereinigen und unnötigen Müll (unter Verwendung von Minus-Wörtern) entfernen.
Die Funktionalität von A-Parser ermöglicht es Ihnen, die Datenerfassungseinstellungen des Scrapers SE::Yandex::SQI für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.
Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.
Gesammelte Daten
- Website-Qualitätsindex (Yandex SQI)
- Daten über das Vorhandensein von Website-Badges (1 - Badge erhalten, 0 - kein Badge):
- Nutzerwahl
- Beliebte Website
- Sichere Verbindung
- Turbo-Seiten
- Ob die Website offiziell ist
- Für die Badges "Nutzerwahl" und "Beliebte Website" kann der Bereitschaftsgrad zum Erhalt des Badges als Zwischenwert von 0 bis 1 erhalten werden, zum Beispiel 0.4.
- Anzahl der Bewertungen, Note und Rating
- Shop-Rating in der Produktsuche und Shop-Rating auf Yandex Market (falls diese Daten für die gesuchte Website verfügbar sind)
Anwendungsfälle
- Bewertung der Nützlichkeit einer Website aus Sicht von Yandex
- Sammeln von Titeln
Abfragen
Als Abfragen muss die Domain der gesuchten Website angegeben werden. Dies kann sowohl mit als auch ohne Protokoll erfolgen, zum Beispiel:
yandex.ru
google.com
vk.com
facebook.com
https://a-parser.com
Formate für die Ergebnisausgabe
A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.
Standardausgabe
Ergebnisformat:
$query: $sqi\n
Beispielergebnis, in dem die ursprüngliche Abfrage und ihr SQI angezeigt werden:
facebook.com: 130000
yandex.ru: -1
https://a-parser.com: 110
google.com: 120000
vk.com: 340000
Wenn der SQI für eine Domain nicht verfügbar ist, wird im Ergebnis -1 angezeigt.
Ausgabe in eine CSV-Tabelle
Ergebnisformat:
[% tools.CSVline(query, sqi, rating); %]
Dateiname:
$datefile.format().csv
Anfangstext:
Domain,Rating,Autor,Preis
Damit die Option "Anfangstext" im Task-Editor verfügbar ist, muss "Mehr Optionen" aktiviert werden. In den "Anfangstext" schreiben wir die Spaltennamen durch Komma getrennt und lassen die zweite Zeile leer.
Speichern im SQL-Format
Ergebnisformat:
[% "INSERT INTO sqi VALUES('" _ query _ "', '" _ sqi _ "', '" _ rating _ "')\n" %]
Beispielergebnis:
INSERT INTO sqi VALUES('google.com', '122000', '87')
INSERT INTO sqi VALUES('yandex.ru', 'none', '92')
INSERT INTO sqi VALUES('https://a-parser.com', '200', '')
INSERT INTO sqi VALUES('vk.com', '326000', '73')
INSERT INTO sqi VALUES('facebook.com', '117000', '66')
Ergebnis-Dump in JSON
Allgemeines Ausgabeformat:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.sqi = p1.sqi;
obj.rating = p1.rating;
obj.json %]
Anfangstext:
[
Endtext:
]
Beispielergebnis:
[{"query":"vk.com","rating":73,"sqi":326000},
{"query":"google.com","rating":87,"sqi":122000},
{"query":"https://a-parser.com","rating":"","sqi":200},
{"query":"yandex.ru","rating":92,"sqi":"none"},
{"query":"facebook.com","rating":66,"sqi":117000}]
Damit die Optionen "Anfangstext" und "Endtext" im Task-Editor verfügbar sind, muss "Mehr Optionen" aktiviert werden.
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| AntiGate preset | default | Auswahl des Presets Util::AntiGate, Details zur Einstellung hier |
| AntiGate preset for old captcha | default | Analog zu AntiGate preset, wird aber nur für gewöhnliche (alte, als einzelnes Bild vorliegende) Captchas verwendet. Wenn hier kein Preset ausgewählt ist, wird für solche Captchas das in AntiGate preset gewählte Preset verwendet. |
| Experimental img captcha max count | 5 | Maximale Anzahl wiederholter Captcha-Bilder pro Versuch |
| Preffered captcha type | Click | Wahl des bevorzugten Captcha-Typs: Click oder Puzzle |
| Use sessions | ☑ | Speichert gute Sitzungen, was eine noch schnellere Datenerfassung mit weniger Fehlern ermöglicht |
