Ana içeriğe atla

SE::Google::Cache - Google önbelleğinde sayfa varlığı kontrolü

Google Cache

Veri kazıyıcı incelemesi

Google Cache veri kazıyıcı, bir sayfanın Google önbelleğinde bulunup bulunmadığını kontrol eder.

Sonuçların ihtiyacınız olan biçimde ve yapıda kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda çıktı almanıza olanak tanıyan yerleşik güçlü Template Toolkit şablon motoru sayesinde mümkündür.

Toplanan veriler

Toplanan veriler
  • Sayfanın önbellekteki indekslenme tarihi
  • Sayfanın Unix formatında indekslenme tarihi
  • Sayfanın önbellekte bulunma durumu
  • Google araç çubuğu (google-toolbar) olmadan sayfa verileri

Kullanım durumları

  • Bir sayfanın Google önbelleğinde olup olmadığının belirlenmesi
  • Google'ın son anlık görüntüsünün (snapshot) tarihini alma
  • Google'ın son anlık görüntüsünün tarihini Unix formatında alma
  • Önbellekte bulunan sayfanın içeriğini alma

Sorgular

Sorgu olarak sayfa URL'si belirtilmelidir, örneğin:

https://a-parser.com
https://lenta.ru/

Sonuç çıktı seçenekleri

Varsayılan çıktı

Sonuç formatı:

$query: $exists - $date\n

Alan adının, önbellekte bulunma durumunun (1 veya 0) ve önbelleğe alma tarihinin görüntülendiği sonuç örneği:

https://lenta.ru/: 1 -  25 Dec 2020 10:44:05 GMT

CSV tablosuna çıktı

Sonuç formatı:

[% tools.CSVline(query, exists, date, timestamp) %]

Sonuç örneği:

https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944

Olası ayarlar

ParametreVarsayılan değerAçıklama
Use sessionsİyi oturumları kaydederek daha hızlı veri çekme sağlar ve daha az hata alınmasına yardımcı olur
Util::ReCaptcha2 presetdefaultReCaptcha'ları aşmak için Util::ReCaptcha2Util::ReCaptcha2 kullanılıp kullanılmayacağını belirler
Remove toolbarSayfadan araç çubuğunun kaldırılıp kaldırılmayacağını belirtir