На входе есть список доменов в txt файле
на выходе нужно получить список email адресов в txt файл
в формате (домен - тематика - email)
Логика работы пресета:
- ищем раздел контактов (с возможностью добавления признаков таких разделов) и в нём парсим уникальные мыльники и сохраняем в формате "домен - title - email".
- парсим уникальные мыльники в шапке или подвале сайта.
- если на сайте есть форма контактов (без отображения мыл), сохраняем такие сайты отдельно (для отдельной логики)
- если на сайте нет мыльников, есть мыльники не в шапке, подвале, разделе контактов или их более 5-ти штук, то сохраняем такие сайты в отдельные списки для ручного анализа и доработки алгоритма парсинга.
Оплата по договоренности.
на выходе нужно получить список email адресов в txt файл
в формате (домен - тематика - email)
Логика работы пресета:
- ищем раздел контактов (с возможностью добавления признаков таких разделов) и в нём парсим уникальные мыльники и сохраняем в формате "домен - title - email".
- парсим уникальные мыльники в шапке или подвале сайта.
- если на сайте есть форма контактов (без отображения мыл), сохраняем такие сайты отдельно (для отдельной логики)
- если на сайте нет мыльников, есть мыльники не в шапке, подвале, разделе контактов или их более 5-ти штук, то сохраняем такие сайты в отдельные списки для ручного анализа и доработки алгоритма парсинга.
Оплата по договоренности.