SE::Google::Cache - Google önbelleğinde sayfa varlığı kontrolü

Veri kazıyıcı incelemesi
Google Cache veri kazıyıcı, bir sayfanın Google önbelleğinde bulunup bulunmadığını kontrol eder.
Sonuçların ihtiyacınız olan biçimde ve yapıda kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda çıktı almanıza olanak tanıyan yerleşik güçlü Template Toolkit şablon motoru sayesinde mümkündür.
Toplanan veriler

- Sayfanın önbellekteki indekslenme tarihi
- Sayfanın Unix formatında indekslenme tarihi
- Sayfanın önbellekte bulunma durumu
- Google araç çubuğu (google-toolbar) olmadan sayfa verileri
Kullanım durumları
- Bir sayfanın Google önbelleğinde olup olmadığının belirlenmesi
- Google'ın son anlık görüntüsünün (snapshot) tarihini alma
- Google'ın son anlık görüntüsünün tarihini Unix formatında alma
- Önbellekte bulunan sayfanın içeriğini alma
Sorgular
Sorgu olarak sayfa URL'si belirtilmelidir, örneğin:
https://a-parser.com
https://lenta.ru/
Sonuç çıktı seçenekleri
Varsayılan çıktı
Sonuç formatı:
$query: $exists - $date\n
Alan adının, önbellekte bulunma durumunun (1 veya 0) ve önbelleğe alma tarihinin görüntülendiği sonuç örneği:
https://lenta.ru/: 1 - 25 Dec 2020 10:44:05 GMT
CSV tablosuna çıktı
Sonuç formatı:
[% tools.CSVline(query, exists, date, timestamp) %]
Sonuç örneği:
https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944
Olası ayarlar
| Parametre | Varsayılan değer | Açıklama |
|---|---|---|
| Use sessions | ☑ | İyi oturumları kaydederek daha hızlı veri çekme sağlar ve daha az hata alınmasına yardımcı olur |
| Util::ReCaptcha2 preset | default | ReCaptcha'ları aşmak için Util::ReCaptcha2 kullanılıp kullanılmayacağını belirler |
| Remove toolbar | ☑ | Sayfadan araç çubuğunun kaldırılıp kaldırılmayacağını belirtir |
