Парсинг контента по ключевым словам для сайтов

  • Автор темы Автор темы woodoo
  • Дата начала Дата начала
А сейчас с последней версией можно сделать пресет который бы включал в себя как в тз у тс парсер текста ? что бы не нужно было разбивать процесс на два и более пресетов .
Если это возможно кто может написать такое ? С предложениями и ценой в лс или сюда ;)
 
Здравствуйте. У нас есть платная поддержка пользователей, где Вы можете заказать парсер любой сложности по составленному ТЗ. Контакты платной поддержки Вы можете посмотреть здесь https://a-parser.com/pages/support. Специалист поддержки находится в отпуске до 12.08.2017, после можете к нему обратится.
 
многоточие можно убрать заменой ... на ничего

Здравствуйте. Подскажите пожалуйста как с помощью регулярки в пресете заменить " ..." ( проблелтроеточие) на ничего? Создал пресет который парсит сниппеты и анкоры и сохраняет их в отдельные папки и отдельные тхт. Убрал теги и декод хтмл, осталось заменить регуляркой. Можете помочь доделать пресет?
 
Здравствуйте. Сделать замену можно использовав конструктор результатов
Например заменить эти символы из сниппетов в SE::Google::Modern SE::Google::Modern можно так
v22zi_180912110036.png
 
Большое спасибо, помогло, но частично. Обычные три точки заменились. Но есть ещё такие строки (в анкорах в основном) где в конце строки стоит какбы маленькое троеточие (оно отличается от обычных трёх точек) - и вот на него не работает замена. Как с ними поступить?
 
Точно так же. С помощью конструктора результатов.Можно либо просто добавить ещё один конструктор со String Replace либо RegEx Replace и перечислять регулярки через | (логическое или)
 
Обычные три точки заменились. Но есть ещё такие строки (в анкорах в основном) где в конце строки стоит какбы маленькое троеточие (оно отличается от обычных трёх точек)
Скопируйте это троеточие и вставьте в регулярку после очередного | и поставьте флаг g .
 
Последнее редактирование:
Если вставить ссылки на youtube, которые парсит А-парсер, в теги iframe и вывести на html странице, то получаем следующее:
screen.png
Почему так происходит?
 
Потому как ссылка которая вставляется в iframe и та по которой размещено видео отличаются
y5a4y_181210111708.png
 
Назад
Верх