1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Не получается спарсить данные со страници (HTML::TextExtractor)

Тема в разделе "Техническая поддержка", создана пользователем miranon, 7 окт 2016.

  1. miranon

    miranon A-Parser Pro License
    A-Parser Pro

    Регистрация:
    6 июн 2012
    Сообщения:
    29
    Симпатии:
    7
    Здравствуйте,
    Мне нужно спарсить данные Linkpop: 122 с этой страници: https://en.seokicks.de/backlinks/a-parser.com
    Протестировал regex, вроде работает: https://regex101.com/r/ZyFndV/1
    A-parser почему то выдает пустые результаты.
    [​IMG]

    Не могу разобратся в чем дело. Нужно что бы был такой результат: https://en.seokicks.de/backlinks/a-parser.com;122
    (или просто a-parser.com;122)

    Может кто нибудь помочь?
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Здравствуйте.
    Первая ошибка - вы применяете регулярку в фильтре для блоков текста. Т.е. вы фильтруете полученные по запросу блоки текста на вхождение регулярного выражения. И т.к. эта регулярка в текстах не сработает, то в результате будет пусто.
    Вторая ошибка - используемый парсер. Для вашей цели правильнее использовать Net::HTTP Net::HTTP.

    Правильный пресет будет выглядеть так:
    [​IMG]
    P.S. В примере я использовал свою регулярку, но ваша тоже будет работать.
     
    miranon нравится это.

Поделиться этой страницей