Помогите с регуляркой

  • Автор темы Автор темы dapanom
  • Дата начала Дата начала

dapanom

A-Parser Enterprise License
A-Parser Enterprise
Здравствуйте

Подскажите пожалуйста, как парсить содержание между тегами. <div class="">бла бла бла</div>, нужно спарсить бла бла бла

Саппорт ответил, можно с помощью регулярных выражений.

Помогите составить для: <div class="">текст</div>
 
cBbRj.png
 
Здравствуйте

<div class="all_btn_left"><a id="scanWord" class="site2" href="javascript:void(0)">Все ответы (<b>ЗАПРОС</b>)</a></div>

Необходимо спарсить ЗАПРОС

Заранее большое спасибо
 
Код:
Все ответы \(<b>(.*?)</b>

P.S. перенес сообщение - ненадо плодить кучу одинаковых тем :)
 
Спасибо!

Еще подскажите, пожалуйста - как настроить результ формат, чтобы было:

запрос:спаршенный текст

Сейчас, с настройками как выше, получается вот так:

5251790_m.jpg
5251790_m.jpg
 
Вопрос решен)
$divs.format('$query: $text\n')

Еще раз спасибо
 
Здравствуйте

Что вписать в Result type и Result format, чтобы спарсить \(<h1>(.*?)</h1>
 
Спасибо!

Еще такой вопрос:

Можно настроить конструктор результатов, чтобы парсились урлы, только без сабдоменов? extract top domain не подходит, т.к. он обрезает ссылку

sub.domain.ru/index.html

Надо, чтобы парсились только такие:
domain.ru/index.html

Или может с помощью регулярных выражений?
 
Та вроде работает все...
ccX9e.png

Выведите в результат $data - посмотрите, что у вас возвращается по запросу.
 
хм, прям мистика какая то:
db5543d3fb420880f72507005b95a0b7.jpeg

код то парсит, а с регулярками пустой результат.
 
Даже незнаю... У меня, как видно выше, с вашими настройками все работает... Проверьте у себя (или по-новой создайте задание), может где-то лишний пробел затерялся...
 
Да вот персет сам
eyJwcmVzZXQiOiJkb21lbjIiLCJ2YWx1ZSI6eyJwcmVzZXQiOiJkb21lbjIiLCJw
YXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJjdXN0b21S
ZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8bGFiZWw+KC4qPyk8L2xh
YmVsPiIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJhcnJheSIsImFycmF5
TmFtZSI6ImxhYmVsIiwicmVzdWx0cyI6WyJkb21haW4iXX0seyJ0eXBlIjoib3Zl
cnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVlIjoiJGxhYmVsLmZvcm1h
dCgnJGRvbWFpblxcbicpIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQi
LCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRl
ZmlsZS5mb3JtYXQoKS50eHQiLCJhZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3Vs
dHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJdLCJ1bmlxdWVR
dWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNlLCJpdGVyYXRv
ck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1aWxkZXJzQWZ0
ZXJJdGVyYXRvciI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJvdmVyd3JpdGUi
OmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIsIm1vcmVPcHRp
b25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRzQXBwZW5kIjoi
IiwicXVlcnlCdWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6W10sImNvbmZp
Z092ZXJyaWRlcyI6W119fQ==
прям незнаю, там кода то две строчки.
 
Ну вот именно в этом пресете нужно добавить флаг g в регулярку.
И в самой регулярке пропущен пробел после <label
Код:
<label >(.*?)</label>
И все работает.
ABLug.png

Но странно то, что на вашем первом скрине все это есть, и он не работал.
 
Спасибо, действительно все заработало как надо!
 
Назад
Верх