Не получается спарсить данные со страници (HTML::TextExtractor)

miranon · 7 окт 2016

Здравствуйте,
Мне нужно спарсить данные Linkpop: 122 с этой страници: https://en.seokicks.de/backlinks/a-parser.com
Протестировал regex, вроде работает: https://regex101.com/r/ZyFndV/1
A-parser почему то выдает пустые результаты.

Не могу разобратся в чем дело. Нужно что бы был такой результат: https://en.seokicks.de/backlinks/a-parser.com;122
(или просто a-parser.com;122)

Может кто нибудь помочь?

Support · 7 окт 2016

Здравствуйте.
Первая ошибка - вы применяете регулярку в фильтре для блоков текста. Т.е. вы фильтруете полученные по запросу блоки текста на вхождение регулярного выражения. И т.к. эта регулярка в текстах не сработает, то в результате будет пусто.
Вторая ошибка - используемый парсер. Для вашей цели правильнее использовать Net::HTTP.

Правильный пресет будет выглядеть так:

P.S. В примере я использовал свою регулярку, но ваша тоже будет работать.

Не получается спарсить данные со страници (HTML::TextExtractor)

miranon A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Не получается спарсить данные со страници (HTML::TextExtractor)

miranon A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

miranon A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise