Делимся регулярками

  • Автор темы Автор темы 7make
  • Дата начала Дата начала
А кто бы помог, составить регулярку по парсингу полных предложений.

Должна быть такая примерно. больше 4 пробелов, больше 100 символов, без спец симвоволов, оканчивается на точку, после точки пробел.

Сколько не пытался более мение рабочий вариант не получился, не разбираюсь в регулярках)))

Смысл спарсить много тематических предложений не затачивая под каждый рес =)

Вот по твоему алгоритму, только без пробела в конце, имхо это не важно:
Код:
(\b[A-ZА-Я](?:\w+[,;:]? ){3,}\w{2,}[.!?])
а можно пример как использовать эту регулярку?
 
а можно пример как использовать эту регулярку?

1faw3.png
 
к парсеру сниппетов это применимо? попробовал, но выдает ошибку



Вот так настраивал

 
Последнее редактирование:
к любому тексту применимо, только сохраняй в другой массив, sentences например назови его
 
Помогите составить регулярку чтобы текущий запрос $query, если он многословник, уменьшить до 3 слов
 
Конструктор запросов -> Regex Match -> $1 to query
Код:
^([^\s]+(?:$|\s+)){1,3}
 
Регулярное выражение для сбора email pasword неподскажет никто
 
Последнее редактирование:
Как вариант, для вот таких строк
Код:
[email protected]:pass123!word
можно использовать такую регулярку:
Код:
((?>\b[-a-z0-9._%+]+)@[a-z0-9.-]+\.[a-z]{2,6}\b:.+?)(?>\s|$)
т.е. email и через разделитель : строка до первого пробела, переноса или конца строки.
 
сбор ссылок по этому выражению ((?>\b[-a-z0-9._%+]+)@[a-z0-9.-]+\.[a-z]{2,6})\b
идет хорошо а когда вставляю то выражение которые вы посоветовали сбор вроде идет но в результатах ничего(
 
Дайте пример запросов.
Скорее всего на страницах нету искомых строк. Но проверить я не могу без ваших запросов.
а если идет то почему то ссылкой получается [email protected]:qsuro9skk,https://answers.yahoo.com/question/index?qid=20140829071038aasxjch<br
Правильно, регулярка забирает мейл и через двоеточие любой набор символов до первого пробела, перевода или конца строки. Т.е. в регулярке выше считается, что пароль может содержать любые символы, кроме пробела. Если у вас другие критерии паролей - указывайте это в регулярном выражении. Детальнее о регулярках: http://a-parser.com/wiki/regex/
 
Ребята очень нужна помощь! Помогите!
Нужны пару регулярок (для чистки снипетов во время парсинга под методом RegEx Replace):
1. Удалять предложение (строку) если оно начинается с маленькой буквы.
2. Проверка и постановка точки в конце СТРОКИ если ее там нету.

п.с. не забудьте подсказать заодно с каким флагом его юзать.
 
Может у кого есть иные решения или форматы чистки? Подскажите плиз, не силен в регулярках!
 
Давненько уже просил прикрутить конструктор регулярок по аналогии, как в зенке.
Было бы капец, как удобно. Ведь не все знают, как их составлять.
 
Назад
Верх