SE::Google::Cache - Überprüfung des Vorhandenseins von Seiten im Google-Cache

Übersicht des Parsers
Der Google Cache Parser prüft das Vorhandensein einer Seite im Google-Cache.
Die Speicherung der Ergebnisse ist dank der integrierten leistungsstarken Template-Engine Template Toolkit in jeder gewünschten Form und Struktur möglich. Dies erlaubt die Anwendung zusätzlicher Logik auf die Ergebnisse und die Datenausgabe in verschiedenen Formaten, einschließlich JSON, SQL und CSV.
Gesammelte Daten

- Indexierungsdatum der Seite im Cache
- Indexierungsdatum der Seite im Unix-Format
- Vorhandensein der Seite im Cache
- Seitendaten ohne Google-Toolbar
Anwendungsfälle
- Feststellen des Vorhandenseins einer Seite im Google-Cache
- Abrufen des Datums des letzten Google-Snapshots
- Abrufen des Datums des letzten Google-Snapshots im Unix-Format
- Abrufen des Inhalts einer Seite, die sich im Cache befindet
Abfragen
Als Abfragen müssen URLs zu den Seiten angegeben werden, zum Beispiel:
https://a-parser.com
https://lenta.ru/
Beispiele für die Ergebnisausgabe
Standardausgabe
Ergebnisformat:
$query: $exists - $date\n
Beispielergebnis, in dem die Domain, das Vorhandensein im Cache (1 oder 0) und das Caching-Datum angezeigt werden:
https://lenta.ru/: 1 - 25 Dec 2020 10:44:05 GMT
Ausgabe in eine CSV-Tabelle
Ergebnisformat:
[% tools.CSVline(query, exists, date, timestamp) %]
Beispielergebnis:
https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Use sessions | ☑ | Speichert gute Sitzungen, was eine noch schnellere Datenerfassung bei weniger Fehlern ermöglicht |
| Util::ReCaptcha2 preset | default | Bestimmt, ob Util::ReCaptcha2 zur Umgehung von ReCaptchas verwendet werden soll |
| Remove toolbar | ☑ | Gibt an, ob die Toolbar von der Seite entfernt werden soll |
