1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение [1.2.1515] HTML::EmailExtractor - добавить выбор движка парсера

Тема в разделе "1.2.1549", создана пользователем mustr, 6 апр 2022.

  1. mustr

    mustr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    40
    Симпатии:
    12
    Некоторые сайты защищают почтовые адреса с помощью JavaScript, и без его исполнения невозможно получить почту. Также есть сайты на современных JavaScript движках, недоступные стандартному HTTP парсеру.

    Поэтому есть предложение добавить выбор движка парсера HTTP или Chrome по аналогии с парсерами HTML::TextExtractor и HTML::LinkExtractor.

    Пример страницы с защищённым email недоступным стандартному парсеру EmailExtractor, но легко получаемым с помощью Net::HTTP с движком Chrome - https://www.optimism.ru/howtofind/
     
  2. mustr

    mustr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    40
    Симпатии:
    12
    Сделали в версии 1.2.1549.
     

Поделиться этой страницей