Перейти к основному содержимому

SE::Google::Cache - Проверка наличия страниц в кеше Google

Обзор парсера Google Cache#

img

Парсер Google Cache проверяет наличие страницы в кеше Google.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

Собираемые данные#

img

  • Дата индексации страницы в кеше
  • Дата индексации страницы в Unix-формате
  • Наличие страницы в кеше
  • Данные страницы без google-tollbar

Запросы#

  • В качестве запросов необходимо указывать url на страницу, например:
https://a-parser.com
https://lenta.ru/

Варианты использования#

  • Определение наличия страницы в кеше Google
  • Получение даты последнего снепшота Google
  • Получение даты последнего снепшота Google в Unix-формате
  • Получение контента страницы, которая находится в кеше

Результаты#

  • По умолчанию в результате отображены домен, наличие в кеше (1 или 0), дата кеширования
https://lenta.ru/: 1 - 25 Dec 2020 10:44:05 GMT

Варианты вывода результатов#

Вывод в CSV#

Формат результата:

[% tools.CSVline(query, exists, date, timestamp) %]

Пример результата:

https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944

Возможные настройки#

ПараметрЗначение по умолчаниюОписание
Use sessionsCохраняет хорошие сессии что позволяет парсить еще быстрее, получая меньшее число ошибок.
Util::ReCaptcha2 presetdefaultПресет парсера Util::ReCaptcha2 Необходимо предварительно настроить парсер Util::ReCaptcha2 - указать свой ключ доступа и другие параметры, после чего выбрать созданный пресет здесь
Последнее обновление