Задача:
- Минимальная версия A-Parser:
- 1.1.200
Решение:
- Необходимо из Гугла получить ссылки на страницы, содержащие эти кейворды из заданного списка (при этом поиск нужно делать за последнюю неделю)
- Помимо ссылок на сами страницы нужно получить еще и ссылки на кэш этих страниц в Гугле
- Из полученного списка страниц надо получить их домены второго уровня, чтобы понять Google PR главной страницы сайта
- Также нужно узнать какую CMS использует каждый сайт
- Из whois получить email для каждого домена
- Результаты представить в виде набора вложенных папок и текстовых файлов
Задача решается двумя заданиями:
На выходе получается требуемая структура:
- Первое парсит ссылки по кейвордам из файла для второго задания
- Второе делает всю остальную работу
-
Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!Скрыть объявление
Сохранение результатов нескольких парсеров в разные папки 1.0
Комплексный пример с использованием разных парсеров и сохранением результатов в разных папках