1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Помогите новичку парсить сайты и их майлы

Тема в разделе "Делимся опытом", создана пользователем huk87, 20 сен 2017.

  1. huk87

    huk87 New Member

    Регистрация:
    20 сен 2017
    Сообщения:
    1
    Симпатии:
    0
    Доброго времени суток, стоит задача набить таблицу эксель из 2х колонок,первый столбец майлы, второй сайты которым они принадлежат, если несколько майлов с одного сайта, то ниже строками, а во втором столбце ниже строками одинаковый сайт

    Есть сайт с которого надо выцедить эти данные для таблицы. В ручную это делать крайне долго и тупо, много страниц и 200+ позиций на каждой да и сайтов доноров не один. Есть ли способ как-то автоматом эти данные от туда выцепить и так, чтобы эти данные соответствовали критериям таблицы,а не все в кучу? Заранее благодарю за ответ.
     
    #1 huk87, 20 сен 2017
    Последнее редактирование: 20 сен 2017
  2. Support Юра

    Support Юра A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    13 июн 2017
    Сообщения:
    122
    Симпатии:
    70
    Здравствуйте.
    Ваша задача решается в два этапа.
    Этап первый: используя парсер Net::HTTP Net::HTTP и регулярные выражения, собираем адреса сайтов с которых нужно брать e-mail.
    Этап второй: используя парсер HTML::EmailExtractor HTML::EmailExtractor собираем e-mail адреса. В качестве запроса нужно будет указать файл с адресами сайтов которые были собраны на первом этапе.
    Решить задачу можно или поочередно используя два парсера, или в одном задании используя "цепочку заданий" как Вам удобнее. И в первом и во втором случаях, Вы должны иметь лицензию на использование парсера.
    Также Вы можете обратится в платную поддержку, для заказа парсера по Вашему заданию, координаты платной поддержки здесь https://a-parser.com/pages/support/
     

Поделиться этой страницей