1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение Полный проход парсера по tries при неудачных запросах

Тема в разделе "Отклоненные задачи", создана пользователем worker, 25 мар 2014.

  1. worker

    worker A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    29 июн 2013
    Сообщения:
    24
    Симпатии:
    2
    Думаю, имеет смысл сделать в виде настройки вариант полного прохода парсера по tries, если получили ответ 4xx или 5xx. Может быть полезно при:
    1. Клоакинге проксей на сайте, который парсится
    2. Прокси выдаёт 4хх, 5хх независимо от сайта, который парсится
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.339
    Симпатии:
    1.799
    в настройках Net::HTTP Net::HTTP можно выставить Good status, или речь о чем то другом?
     
  3. worker

    worker A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    29 июн 2013
    Сообщения:
    24
    Симпатии:
    2
    Мы с тобой в аське как-то говорили. Суть в том, что я ловил случаи, когда авмпрокси отдают 404 или же 5xx, даже когда сайт, который парсится, функционирует верно.
    Это или глюки прокси или же сайт клоачит некоторые сети. Тогда есть смысл полностью пройтись по кол-ву tries.
     
  4. worker

    worker A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    29 июн 2013
    Сообщения:
    24
    Симпатии:
    2
    Оказалось, что это оно.
     

Поделиться этой страницей