1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 1300+ и мы растем!
    Скрыть объявление

FAQ по использованию фильтров

Тема в разделе "Делимся опытом", создана пользователем Forbidden, 26 дек 2013.

  1. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.217
    Симпатии:
    1.727
    Проверка базы сайтов на нахождение определенного текста на странице
    На входе - файл с ссылками, на выходе - файл с ссылками где встречается искомый текст

    Используем парсер Net::HTTP для скачивания искомой страницы, в результат сохраняем запрос(ссылку которую проверяем):
    [​IMG]
    Фильтруем $data - контент скачанной страницы, тип фильтра Contain string(содержит строку) и указываем саму строку
    Под эту задачу так же подходит фильтр по регулярному выражению(RegEx match)

    Другие примеры:
    У фильтров есть множество вариантов применения, спрашивайте непонятные моменты в этом топике
     
    #1 Forbidden, 26 дек 2013
    Последнее редактирование модератором: 18 окт 2014
    Rafa, well18 и Dodgy нравится это.
  2. vakravcov

    vakravcov A-Parser Pro License
    A-Parser Pro

    Регистрация:
    2 июл 2014
    Сообщения:
    17
    Симпатии:
    0
    Подскажите как реализовать следующую проверку: на входе - файл с ссылками, проверяем наличие текста в <body>***</body> Результат нужно получить в виде списка всех ссылок, со значениями 0 (нет совпадений) или 1 (есть совпадения)

    http://site.ru/example-1.html,0
    http://site.ru/example-2.html,1
    http://site.ru/example-3.html,0

    Заранее спасибо.
     
  3. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.217
    Симпатии:
    1.727
    Фильтрами это не решить, т.к. когда результат отфильтровывается он не записывается в файл, т.е. с помощью фильтров можно оставлять в файле ссылки только там где есть текст, или наоборот только там где нет

    зато легко решить с помощью Parse custom result:
    [​IMG]
     
    vakravcov нравится это.

Поделиться этой страницей