Zum Hauptinhalt springen

SE::Yandex::SQI - Überprüfung des Website-Qualitätsindex (SQI) bei Yandex

Übersicht des Parsers

Übersicht des ParsersSE::Yandex::SQISE::Yandex::SQI – Überprüfung des Website-Qualitätsindex (SQI) bei Yandex. Unglaublich schneller Parser, Arbeitsgeschwindigkeit 3000-7000 Abfragen pro Minute.

Sie können die automatische Abfragevervielfältigung, die Substitution von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten. Durch die Verwendung der Ergebnisfilterung können Sie das Ergebnis sofort bereinigen und unnötigen Müll (unter Verwendung von Minus-Wörtern) entfernen.

Die Funktionalität von A-Parser ermöglicht es Ihnen, die Datenerfassungseinstellungen des Scrapers SE::Yandex::SQI für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.

Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Gesammelte Daten

  • Website-Qualitätsindex (Yandex SQI)
  • Daten über das Vorhandensein von Website-Badges (1 - Badge erhalten, 0 - kein Badge):
    • Nutzerwahl
    • Beliebte Website
    • Sichere Verbindung
    • Turbo-Seiten
    • Ob die Website offiziell ist
  • Für die Badges "Nutzerwahl" und "Beliebte Website" kann der Bereitschaftsgrad zum Erhalt des Badges als Zwischenwert von 0 bis 1 erhalten werden, zum Beispiel 0.4.
  • Anzahl der Bewertungen, Note und Rating
  • Shop-Rating in der Produktsuche und Shop-Rating auf Yandex Market (falls diese Daten für die gesuchte Website verfügbar sind)

Anwendungsfälle

  • Bewertung der Nützlichkeit einer Website aus Sicht von Yandex
  • Sammeln von Titeln

Abfragen

Als Abfragen muss die Domain der gesuchten Website angegeben werden. Dies kann sowohl mit als auch ohne Protokoll erfolgen, zum Beispiel:

yandex.ru 
google.com
vk.com
facebook.com
https://a-parser.com

Formate für die Ergebnisausgabe

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.

Standardausgabe

Ergebnisformat:

$query: $sqi\n

Beispielergebnis, in dem die ursprüngliche Abfrage und ihr SQI angezeigt werden:

facebook.com: 130000  
yandex.ru: -1
https://a-parser.com: 110
google.com: 120000
vk.com: 340000

Wenn der SQI für eine Domain nicht verfügbar ist, wird im Ergebnis -1 angezeigt.

Ausgabe in eine CSV-Tabelle

Ergebnisformat:

[% tools.CSVline(query, sqi, rating); %]

Dateiname:

$datefile.format().csv

Anfangstext:

Domain,Rating,Autor,Preis

Tipp

Damit die Option "Anfangstext" im Task-Editor verfügbar ist, muss "Mehr Optionen" aktiviert werden. In den "Anfangstext" schreiben wir die Spaltennamen durch Komma getrennt und lassen die zweite Zeile leer.

Speichern im SQL-Format

Ergebnisformat:

[% "INSERT INTO sqi VALUES('" _ query _ "', '" _ sqi _ "', '" _ rating _ "')\n" %]

Beispielergebnis:

INSERT INTO sqi VALUES('google.com', '122000', '87')
INSERT INTO sqi VALUES('yandex.ru', 'none', '92')
INSERT INTO sqi VALUES('https://a-parser.com', '200', '')
INSERT INTO sqi VALUES('vk.com', '326000', '73')
INSERT INTO sqi VALUES('facebook.com', '117000', '66')

Ergebnis-Dump in JSON

Allgemeines Ausgabeformat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.sqi = p1.sqi;
obj.rating = p1.rating;

obj.json %]

Anfangstext:

[

Endtext:

]

Beispielergebnis:

[{"query":"vk.com","rating":73,"sqi":326000},
{"query":"google.com","rating":87,"sqi":122000},
{"query":"https://a-parser.com","rating":"","sqi":200},
{"query":"yandex.ru","rating":92,"sqi":"none"},
{"query":"facebook.com","rating":66,"sqi":117000}]
Tipp

Damit die Optionen "Anfangstext" und "Endtext" im Task-Editor verfügbar sind, muss "Mehr Optionen" aktiviert werden.

Mögliche Einstellungen

ParameterStandardwertBeschreibung
AntiGate presetdefaultAuswahl des Presets Util::AntiGateUtil::AntiGate, Details zur Einstellung hier
AntiGate preset for old captchadefaultAnalog zu AntiGate preset, wird aber nur für gewöhnliche (alte, als einzelnes Bild vorliegende) Captchas verwendet. Wenn hier kein Preset ausgewählt ist, wird für solche Captchas das in AntiGate preset gewählte Preset verwendet.
Experimental img captcha max count5Maximale Anzahl wiederholter Captcha-Bilder pro Versuch
Preffered captcha typeClickWahl des bevorzugten Captcha-Typs: Click oder Puzzle
Use sessionsSpeichert gute Sitzungen, was eine noch schnellere Datenerfassung mit weniger Fehlern ermöglicht