SE::Google::Cache - Проверка наличия страниц в кеше Google
Обзор парсера Google Cache
Парсер Google Cache проверяет наличие страницы в кеше Google.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Дата индексации страницы в кеше
- Дата индексации страницы в Unix-формате
- Наличие страницы в кеше
- Данные страницы без google-tollbar
Запросы
- В качестве запросов необходимо указывать url на страницу, например:
https://a-parser.com
https://lenta.ru/
Варианты использования
- Определение наличия страницы в кеше Google
- Получение даты последнего снепшота Google
- Получение даты последнего снепшота Google в Unix-формате
- Получение контента страницы, которая находится в кеше
Результаты
- По умолчанию в результате отображены домен, наличие в кеше (1 или 0), дата кеширования
https://lenta.ru/: 1 - 25 Dec 2020 10:44:05 GMT
Варианты вывода результатов
Вывод в CSV
Формат результата:
[% tools.CSVline(query, exists, date, timestamp) %]
Пример результата:
https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944
Возможные настройки
к сведению
Параметр | Значение по умолчанию | Описание |
---|---|---|
Use sessions | ☑ | Cохраняет хорошие сессии что позволяет парсить еще быстрее, получая меньшее число ошибок |
Util::ReCaptcha2 preset | default | Определяет использовать ли ![]() |
Remove toolbar | ☑ | Указывает нужно ли удалять тулбар со страницы |