Крашится a-parser, если попадаются мусорные страницы с большим кол-вом текста, пример:Код:(\b[A-ZА-Я](?:\w+[,;:]? ){3,}\w{2,}[.!?])
https://sites.google.com/a/q.tapdoa...schwarz-thermostat-massage-wellness---mistral
Как этого избежать?
Следуйте инструкциям в видео ниже, чтобы узнать, как установить наш сайт как веб-приложение на главный экран вашего устройства.
Примечание: Эта функция может быть недоступна в некоторых браузерах.
Крашится a-parser, если попадаются мусорные страницы с большим кол-вом текста, пример:Код:(\b[A-ZА-Я](?:\w+[,;:]? ){3,}\w{2,}[.!?])
(\b[A-ZА-Я](?:\w+[,;:]? ){3,40}\w{2,}[.!?])
Как самый простой вариант:Какой регуляркой поудалять слова и предложения с кириллицей Блокнотом++?
[а-я]+
Здравствуйте. Дайте ссылку на сайт и укажите перед каким текстом искать тег div, указать желательно скриншотом.А как найти первый тег <div(.*?)> перед текстом? Маркер текста есть.
Чет не хочет он у меня искать.
<h2>
<img src="url.com/1.jpg">
<a href="url.com"/>То что нужно</a>
</h2>
$as.format('$a\n')
Нужно сделать проверку на наличие слов ДО первого разделителя |
<tr id="msg_15758943780799221044_item" class="js-messageline messageline messageline_unread">
<td class="messageline__box messageline__box_left">
<label class="messageline__label" for="msg_15758943780799221044">
<input type="checkbox" id="msg_15758943780799221044" name="id" value="15758943780799221044" class="js-messageline-checkbox" />
</label>
</td>
<td class="messageline__box">
<a class="messageline__link" href="/message/15758943780799221044">
<span class="messageline__from">
<img src="https://img.imgsmail.ru/r/m_img/[email protected]" alt="" width="8" height="8" />
Почта Mail.ru
</span>
<span class="messageline__subject">
Вход с нового устройства в аккаунт
</span>
</a>
</td>
<td class="messageline__box messageline__box_right">
<div class="js-messageline-rightcol messageline__actions">
<a class="messageline__flag icon icon_message-flag js-flag" href="/cgi-bin/movemsg?form_sign=5c986384c7882115d314b703c13129ef&form_token=447966007f034c7a1901510e0105020d0657040b0d0b060400520700005006090354000a080a085557165858435459445e&id=15758943780799221044&mark=1&markmessage=6"></a>
<span class="messageline__date">15:26</span>
</div>
<a class="js-messageline-scroller messageline__scroller" href="#btoolbar"></a>
</td>
</tr>
<tr id="msg_15752166650211077108_item" class="js-messageline messageline messageline_unread">
<td class="messageline__box messageline__box_left">
<label class="messageline__label" for="msg_15752166650211077108">
<input type="checkbox" id="msg_15752166650211077108" name="id" value="15752166650211077108" class="js-messageline-checkbox" />
</label>
</td>
<td class="messageline__box">
<a class="messageline__link" href="/message/15752166650211077108">
<span class="messageline__from">
<img src="https://img.imgsmail.ru/r/m_img/[email protected]" alt="" width="8" height="8" />
[email protected]
</span>
<span class="messageline__subject">
Ваше сообщение не доставлено. Mail failure.
</span>
</a>
</td>
A-Parser - это профессиональная платформа для сбора данных промышленного масштаба: 10 000+ потоков, 110+ парсеров и гибкость Node.js. Автоматизируйте задачи в SEO, e-commerce и арбитраже трафика с непревзойденной скоростью и масштабируемостью
Нужна помощь с настройкой или работой парсера? Напишите в поддержку, поможем довести все до результата.
Написать в поддержку