Парсинг e-mail из страниц контактов

Парсинг e-mail из страниц контактов 1.0

Доступно владельцам лицензии
Минимальная версия A-Parser
1.1.500
Задача: нужно зайти на сайт, получить из главной title и description, найти ссылки на страницы контактов, перейти по ним и спарсить все e-mail. В результат вывести ссылку на главную страницу, ссылку на страницу контактов, title, description и найденные e-mail.
DgHtl.png

  • Задача решается с помощью HTML::LinkExtractor HTML::LinkExtractor и $tools.query.
  • На первом этапе получаем тайтл, дескрипшн и ссылки на страницы контактов и подставляем все это в запросы с помощью tools.query.add.
  • На втором этапе разделяем полученные данные Конструктором запросов, парсим регуляркой мейлы со страниц и выводим полученные ранее данные вместе с мейлами.
Пример результата:
http://www.altium.com;http://www.altium.com/contact-us;PCB Design Software | Innovation For PCB Design | PCB Tools Altium;The Best PCB Design Software | Altium creates high-powered tools for PCB designers with industry leading schematic capture, layout and prototyping.;[email protected], [email protected], [email protected], [email protected], [email protected], [email protected]
http://4pda.ru;not found contact pages
http://www.altium.com;http://www.altium.com/support;PCB Design Software | Innovation For PCB Design | PCB Tools Altium;The Best PCB Design Software | Altium creates high-powered tools for PCB designers with industry leading schematic capture, layout and prototyping.;[email protected], [email protected], [email protected], [email protected], [email protected], [email protected]
http://www.altium.com;http://www.altium.com/company/newsroom/media-contacts;PCB Design Software | Innovation For PCB Design | PCB Tools Altium;The Best PCB Design Software | Altium creates high-powered tools for PCB designers with industry leading schematic capture, layout and prototyping.;[email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected]
  • Like
Реакции: Apalon
Автор
Support
Загрузок
77
Просмотры
77
Первый выпуск
Обновление

Рейтинги

0,00 звёзд Оценок: 0

Ещё ресурсы от Support

Назад
Верх