Нужен пресет для парсинга контактов

vorhes80

A-Parser Enterprise License
A-Parser Enterprise
На входе есть список доменов в txt файле
на выходе нужно получить список email адресов в txt файл
в формате (домен - тематика - email)

Логика работы пресета:
- ищем раздел контактов (с возможностью добавления признаков таких разделов) и в нём парсим уникальные мыльники и сохраняем в формате "домен - title - email".
- парсим уникальные мыльники в шапке или подвале сайта.
- если на сайте есть форма контактов (без отображения мыл), сохраняем такие сайты отдельно (для отдельной логики)
- если на сайте нет мыльников, есть мыльники не в шапке, подвале, разделе контактов или их более 5-ти штук, то сохраняем такие сайты в отдельные списки для ручного анализа и доработки алгоритма парсинга.

Оплата по договоренности.
 
Назад
Верх