1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение [1.2.2036] Работа SE::Yandex

Тема в разделе "1.2.2062", создана пользователем Support, 6 сен 2023.

  1. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.377
    Симпатии:
    2.107
    На фоне усиления защиты со стороны Яндекса был внесен ряд правок в SE::Yandex SE::Yandex
    На данный момент ситуация такая:
    Лучше всего парсится 1 страница выдачи, даже без увеличения количества попыток:
    [​IMG]
    Чем больше страниц выдачи, тем сложнее парсить. Разгадывание каптч немного улучшает ситуацию, но не сильно:
    [​IMG]

    Рекомендации по парсингу Яндекса
    • Минимизировать количество страниц выдачи для парсинга
    • Использовать как можно более чистые прокси и как можно больше
    • Увеличивать количество попыток
    • Использовать антигейт (на данный момент каптчу Яндекса умеют разгадывать 2captcha, RuCaptcha и Captcha.Guru)
    Также, при подключенном антигейте можно экспериментировать с опцией Experimental img captcha max count, которая указывает парсеру повторять попытки без сброса сессии при повторных каптчах. В некоторых случаях это улучшает производительность.
     

    Вложения:

    #1 Support, 6 сен 2023
    Последнее редактирование: 6 сен 2023
    d1 нравится это.
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.377
    Симпатии:
    2.107
    2 страницы выдачи, 50 попыток, без антигейта, 300 потоков
    [​IMG]
     
    d1 нравится это.

Поделиться этой страницей