Регулярка обрабатывается не совсем корректно

Kreola · 23 дек 2014

Приветствую!
Есть объявление http://www.bezaat.com/ksa/mecca/properties-for-sale/multi-family-home/archive/11219476
Еще нерабочие: http://www.bezaat.com/tunisia/tunis/business-finance/business-records/ad/11438870
http://www.bezaat.com/ksa/mecca/travel/external-tourism/ad/9612031
Там есть строка с городом.

Пишу такую регулярку: <li>.*?المدينة.*?<span>(.*?)<\/span><\/li>
В http://www.regexr.com/3a4b8 все работает четко, только сам убираю переносы строк.
В парсере же вижу вот такое:
<city>1 شهر</span>
</li>
<li>
البلد  
<span>السعودية</city>
Почему он захватывает лишний <span> не могу понять.
Таких ошибок немного, но они есть. Хотелось бы их исключить.
При этом тут http://www.bezaat.com/ksa/mecca/properties-for-sale/hotels/ad/10991164
Все работает правильно.
Подскажите как правильнее сделать.

Forbidden · 23 дек 2014

Регулярка обрабатывается совсем корректно, другое дело что она составлена не правильно

Надо составлять более строгие и корректные выражения которые будут вытаскивать нужные результаты а не пол страницы...

Kreola · 23 дек 2014

Я веду к тому, что если бы существовало что-то типа переменных, которым можно было бы присваивать некие границы начала и конца, а потом к ней применять регулярное выражение, было бы куда проще. А пытатся написать регулярку для полного кода страницы куда более трудно.

Forbidden · 23 дек 2014

Kreola сказал(а): ↑

Я веду к тому, что если бы существовало что-то типа переменных, которым можно было бы присваивать некие границы начала и конца, а потом к ней применять регулярное выражение, было бы куда проще. А пытатся написать регулярку для полного кода страницы куда более трудно.
Нажмите, чтобы раскрыть...

ты можешь одной регуляркой вытаскивать нужную часть страницы, а затем второй регуляркой вытаскивать нужную информацию из предыдущего куска
тут нет ничего космического, и не надо придумывать какие то непонятные вещи

Регулярка обрабатывается не совсем корректно

Kreola Member

Forbidden Administrator
Команда форума A-Parser Enterprise

Kreola Member

Forbidden Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Регулярка обрабатывается не совсем корректно

Kreola Member

Forbidden Administrator Команда форума A-Parser Enterprise

Kreola Member

Forbidden Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

Forbidden Administrator
Команда форума A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise