Zum Hauptinhalt springen

SE::Google::Cache - Überprüfung des Vorhandenseins von Seiten im Google-Cache

Google Cache

Übersicht des Parsers

Der Google Cache Parser prüft das Vorhandensein einer Seite im Google-Cache.

Die Speicherung der Ergebnisse ist dank der integrierten leistungsstarken Template-Engine Template Toolkit in jeder gewünschten Form und Struktur möglich. Dies erlaubt die Anwendung zusätzlicher Logik auf die Ergebnisse und die Datenausgabe in verschiedenen Formaten, einschließlich JSON, SQL und CSV.

Gesammelte Daten

Gesammelte Daten
  • Indexierungsdatum der Seite im Cache
  • Indexierungsdatum der Seite im Unix-Format
  • Vorhandensein der Seite im Cache
  • Seitendaten ohne Google-Toolbar

Anwendungsfälle

  • Feststellen des Vorhandenseins einer Seite im Google-Cache
  • Abrufen des Datums des letzten Google-Snapshots
  • Abrufen des Datums des letzten Google-Snapshots im Unix-Format
  • Abrufen des Inhalts einer Seite, die sich im Cache befindet

Abfragen

Als Abfragen müssen URLs zu den Seiten angegeben werden, zum Beispiel:

https://a-parser.com
https://lenta.ru/

Beispiele für die Ergebnisausgabe

Standardausgabe

Ergebnisformat:

$query: $exists - $date\n

Beispielergebnis, in dem die Domain, das Vorhandensein im Cache (1 oder 0) und das Caching-Datum angezeigt werden:

https://lenta.ru/: 1 -  25 Dec 2020 10:44:05 GMT

Ausgabe in eine CSV-Tabelle

Ergebnisformat:

[% tools.CSVline(query, exists, date, timestamp) %]

Beispielergebnis:

https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944

Mögliche Einstellungen

ParameterStandardwertBeschreibung
Use sessionsSpeichert gute Sitzungen, was eine noch schnellere Datenerfassung bei weniger Fehlern ermöglicht
Util::ReCaptcha2 presetdefaultBestimmt, ob Util::ReCaptcha2Util::ReCaptcha2 zur Umgehung von ReCaptchas verwendet werden soll
Remove toolbarGibt an, ob die Toolbar von der Seite entfernt werden soll