Задача: Парсинг поисковой выдачи Google.
Условия:
Скорость: от 5 000 запросов в час.
Глубина: ТОП 100 (не важно, 1 страница и 100 результатов или 10 страниц по 10 результатов)
Софт:
A-Parser (1.2.1794) + Xevil 6 (Beta 21)
Что сейчас:
До 2023, всё работало стабильно, использовались прокси A-parser, проблем не возникало. Сейчас уходят в бан или в цикл проверки (рекапча => капча => рекапча => и в бесконечный повтор до 429 кода ошибки и фактически бана).
Перепробовал десятки прокси. Ситуация схожая.
Вопросы:
1) Проблема в прокси? (Посоветуйте, какими пользуетесь?)
2) Пробка в настройках? (Какие настройки используете?)
3) Проблема в синхронизации между A-Parser + Xevil? (на форуме Xevil, разработчики пишут, что связка hrefer + Xevil работает стабильно)
Решение:
Нашел темы на форуме:
от 28..07.2022 - https://a-parser.com/threads/7593/
от 03.07.2022 - https://a-parser.com/threads/7489/page-3
Далее 03.09.2022, вышло обновление - https://a-parser.com/threads/7671/#post-24524
Но кажется, что проблема не решена.
Условия:
Скорость: от 5 000 запросов в час.
Глубина: ТОП 100 (не важно, 1 страница и 100 результатов или 10 страниц по 10 результатов)
Софт:
A-Parser (1.2.1794) + Xevil 6 (Beta 21)
Что сейчас:
До 2023, всё работало стабильно, использовались прокси A-parser, проблем не возникало. Сейчас уходят в бан или в цикл проверки (рекапча => капча => рекапча => и в бесконечный повтор до 429 кода ошибки и фактически бана).
Перепробовал десятки прокси. Ситуация схожая.
Вопросы:
1) Проблема в прокси? (Посоветуйте, какими пользуетесь?)
2) Пробка в настройках? (Какие настройки используете?)
3) Проблема в синхронизации между A-Parser + Xevil? (на форуме Xevil, разработчики пишут, что связка hrefer + Xevil работает стабильно)
Решение:
Возможно реализовать?после решения капчи XEvil-ом 6.0, и отправки ответа - гугл возвращает Cookie. Нужно не пытаться распознать капчу снова и снова, а просто взять этот Cookie и, сменив прокси, этим же потоком продолжать парсинг, отправляя данные Cookie.
Нашел темы на форуме:
от 28..07.2022 - https://a-parser.com/threads/7593/
от 03.07.2022 - https://a-parser.com/threads/7489/page-3
Далее 03.09.2022, вышло обновление - https://a-parser.com/threads/7671/#post-24524
Но кажется, что проблема не решена.
