1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

исключение сайтов с ненужным контентом

Тема в разделе "Техническая поддержка", создана пользователем uroboka, 5 май 2016.

  1. uroboka

    uroboka A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    3 окт 2015
    Сообщения:
    14
    Симпатии:
    4
    прошу подсказать, при парсинге адалт сайтов часто получаю заглушку ркн. Может ли а парсер приходя на страницу определить заглушку и не парсить эту страницу. И как это реализовать.
    заранее спасибо
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Варианта есть два.
    1. Использовать фильтр и проверять в содержимом полученной страницы эту самую заглушку. Этот вариант позволяет просто пропускать такие сайты.
    2. Использовать функцию Check content. С ее помощью тоже можно проверять контент, но в случае негативного результата, страница будет повторно загружена с другим прокси (в рамках указанного количества попыток), что скорее всего позволит получить страницу без заглушки.
     
    uroboka нравится это.

Поделиться этой страницей