Улучшение [1.2.2036] Работа SE::Yandex

  • Автор темы Автор темы Support
  • Дата начала Дата начала

Support

Administrator
Команда форума
A-Parser Enterprise
На фоне усиления защиты со стороны Яндекса был внесен ряд правок в SE::Yandex SE::Yandex
На данный момент ситуация такая:
Лучше всего парсится 1 страница выдачи, даже без увеличения количества попыток:
ws2rc_230906133853.png
Чем больше страниц выдачи, тем сложнее парсить. Разгадывание каптч немного улучшает ситуацию, но не сильно:
lzz13_230906134125.png

Рекомендации по парсингу Яндекса
  • Минимизировать количество страниц выдачи для парсинга
  • Использовать как можно более чистые прокси и как можно больше
  • Увеличивать количество попыток
  • Использовать антигейт (на данный момент каптчу Яндекса умеют разгадывать 2captcha, RuCaptcha и Captcha.Guru)
Также, при подключенном антигейте можно экспериментировать с опцией Experimental img captcha max count, которая указывает парсеру повторять попытки без сброса сессии при повторных каптчах. В некоторых случаях это улучшает производительность.
 

Вложения

  • upload_2023-9-6_13-39-13.png
    upload_2023-9-6_13-39-13.png
    31,3 КБ · Просмотры: 11
  • upload_2023-9-6_13-41-56.png
    upload_2023-9-6_13-41-56.png
    31,5 КБ · Просмотры: 11
Последнее редактирование:
  • Like
Реакции: d1
2 страницы выдачи, 50 попыток, без антигейта, 300 потоков
vzcil_230906135636.png
 
  • Like
Реакции: d1
Назад
Верх