SE::Google::Cache - Проверка наличия страниц в кеше Google
Обзор парсера
Парсер Google Cache проверяет наличие страницы в кеше Google.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Дата индексации страницы в кеше
- Дата индексации страницы в Unix-формате
- Наличие страницы в кеше
- Данные страницы без google-tollbar
Варианты использования
- Определение наличия страницы в кеше Google
- Получение даты последнего снепшота Google
- Получение даты последнего снепшота Google в Unix-формате
- Получение контента страницы, которая находится в кеше
Запросы
В качестве запросов необходимо указывать url на страницу, например:
https://a-parser.com
https://lenta.ru/
Варианты вывода результатов
Вывод по умолчанию
Формат результата:
$query: $exists - $date\n
Пример результата, в котором отображены домен, наличие в кеше (1 или 0), дата кеширования:
https://lenta.ru/: 1 - 25 Dec 2020 10:44:05 GMT
Вывод в таблицу CSV
Формат результата:
[% tools.CSVline(query, exists, date, timestamp) %]
Пример результата:
https://a-parser.com/wiki/index/,1," 18 Mar 2021 20:05:44 GMT",1616097944
Возможные настройки
примечание
Параметр | Значение по умолчанию | Описание |
---|---|---|
Use sessions | ☑ | Cохраняет хорошие сессии что позволяет парсить еще быстрее, получая меньшее число ошибок |
Util::ReCaptcha2 preset | default | Определяет использовать ли Util::ReCaptcha2 для обхода рекаптч |
Remove toolbar | ☑ | Указывает нужно ли удалять тулбар со страницы |