Перейти к основному содержимому

SE::Google::Cache - Проверка наличия страниц в кеше Google

Google Cache

Обзор парсера

Парсер Google Cache проверяет наличие страницы в кеше Google.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

Собираемые данные

Собираемые данные
  • Дата индексации страницы в кеше
  • Дата индексации страницы в Unix-формате
  • Наличие страницы в кеше
  • Данные страницы без google-tollbar

Варианты использования

  • Определение наличия страницы в кеше Google
  • Получение даты последнего снепшота Google
  • Получение даты последнего снепшота Google в Unix-формате
  • Получение контента страницы, которая находится в кеше

Запросы

В качестве запросов необходимо указывать url на страницу, например:

https://a-parser.com
https://lenta.ru/

Варианты вывода результатов

Вывод по умолчанию

Формат результата:

$query: $exists - $date\n

Пример результата, в котором отображены домен, наличие в кеше (1 или 0), дата кеширования:

https://lenta.ru/: 1 -  25 Dec 2020 10:44:05 GMT

Вывод в таблицу CSV

Формат результата:

[% tools.CSVline(query, exists, date, timestamp) %]

Пример результата:

https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944

Возможные настройки

ПараметрЗначение по умолчаниюОписание
Use sessionsCохраняет хорошие сессии что позволяет парсить еще быстрее, получая меньшее число ошибок
Util::ReCaptcha2 presetdefaultОпределяет использовать ли Util::ReCaptcha2Util::ReCaptcha2 для обхода рекаптч
Remove toolbarУказывает нужно ли удалять тулбар со страницы