-
Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 1500+ и мы растем!Скрыть объявление
HTML::EmailExtractor - парсинг e-mail адресов со страниц сайтов
-
Содержание
Собираемые данные(top)
- Собирает адреса электронной почты с указанных страниц
Возможности(top)
- Переход по внутренним страницам сайта до указанной глубины(опция Parse to level) - позволяет пройтись по всем страницам сайта, собирая внутренние и внешние ссылки
- Определение кодировки сайта
- Определение follow links для ссылок
- Возможность указать считать сабдомены как внутренние страницы сайта
Варианты использования(top)
- Используется для сбора e-mail адресов, которые размещены на страницах сайтов
- Возможность вывода количества e-mail адресов, размещенных на страницах сайта, через переменную $mailcount
Запросы(top)
В запросе необходимо указывать ссылку с которой нужно спарсить e-mail адрес(а)
Опция Parse to level(top)
Указывает парсеру переходить по соседним страницам сайта в глубину до указанного уровня, например:
- Если указан 1-ый уровень то парсер перейдёт по всем ссылкам указанным на исходной странице
- Если указан 2-ой уровень то парсер перейдёт по всем ссылкам указанным на исходной странице + по всем ссылкам собранным со страниц на первом уровне
- т.д.
Результаты(top)
- В результате отображен e-mail адрес(а) сайта
Возможные настройки(top)
Общие настройки для всех парсеров
Misery713 нравится это.