Следуйте инструкциям в видео ниже, чтобы узнать, как установить наш сайт как веб-приложение на главный экран вашего устройства.
Примечание: Эта функция может быть недоступна в некоторых браузерах.
У нас из-за этого случился перерасход на рукапче, т.к. гугл зацикливал капчу. Пока наиболее оптимально работает сбор позиций без разгадывания капчи, но с большим числом попыток (1000 и более).Кто-то уже пробовал парсить с рекапчей + текстовой капчей? Какая скорость выходит?
да только так ... чисто на просях выезжать... про парсинг с xevil рукапчей капмонстром можно забыть... как на долго неизвестно пока... но думаю эти грабли не на один месяц...У нас из-за этого случился перерасход на рукапче, т.к. гугл зацикливал капчу. Пока наиболее оптимально работает сбор позиций без разгадывания капчи, но с большим числом попыток (1000 и более).
На постинг эти программы и сервисы работают норм... на парсинг увы антибот защита и усё..У нас из-за этого случился перерасход на рукапче, т.к. гугл зацикливал капчу. Пока наиболее оптимально работает сбор позиций без разгадывания капчи, но с большим числом попыток (1000 и более).
Да все в курсе событий... просто не всё так радужно и просто...Рукапча выкатили новый пост в блоге, рекомендации собственно такие же, единственное что вызывает вопрос:
В дополнение мы нашли незначительные изменения в процессе вывода капчи, которые могли влиять на процент рабочих токенов.Коменде а-парсера об этом изменении что-то известно?
Статью прочитал... В рукапче наивные гугл палит не только num переменные но и айпиху и количество этих самых запросов с одного айпи или проксей... антибот защита... а то что они в статье накрапали только вершина айсбергаРукапча выкатили новый пост в блоге, рекомендации собственно такие же, единственное что вызывает вопрос:
В дополнение мы нашли незначительные изменения в процессе вывода капчи, которые могли влиять на процент рабочих токенов.Коменде а-парсера об этом изменении что-то известно?
Мы несколько дней тестировали данную проблему и пришли к следующим выводам:
Исходя из этого, мы добавили в парсер Google поддержку текстовой (графической) каптчи. Чтобы она разгадывалась, нужно кроме пресета для
- Google начал значительно жестче банить запросы
- Довольно часто (но не всегда) Google начал выдавать текстовые каптчи (в виде картинки) после рекаптчи
- Зацикливание на рекаптче (или рекаптче->каптче) происходит даже в браузере. Связано это скорее всего с баном IP. Наглядный пример такой ситуации на видео: https://files.a-parser.com/img/52wvo_220609130110.mp4
Util::ReCaptcha2 также выбрать настроенный на нужный сервис пресет для
Util::Antigate. К сожалению, это полностью не решает проблему зацикливания, но повышает шансы на прохождение проверки. Как-то еще повлиять на данную проблему со стороны парсера нет возможности, т.к. Google аналогично ведет себя в браузере.
Кроме этого, для снижения вероятности появления данной проблемы рекомендуем по возможности использовать следующие советы:
По нашим тестам 10 результатов на страницу и указанная страна поиска сильно снижают вероятность появления рекаптчи, а также способствуют принятию ответа на рекаптчу с первой попытки.
- Парсить по 10 результатов на страницу (Results per page)
- Задавать страну поиска (Search from country)
- Использовать как можно больше прокси, которые либо заточены под Google, либо максимально "чистые"
- Парсить без подключения сервисов разгадывания, используя большое кол-во попыток (Request retries)
P.S. Ситуация и рекомендации актуальны на данный момент, в будущем Google может изменить поведение.
да только так ... чисто на просях выезжать... про парсинг с xevil рукапчей капмонстром можно забыть... как на долго неизвестно пока... но думаю эти грабли не на один месяц...
Скорее всего из за запросов вида site:... были бы другие... был бы антибот... и ляма бы не было... проверенно лично ... только палится и сразу зацикливает и не принимает капчу...плюс по скрину вижу запросы простые без операторов...Прозрачные эпоксидные смолы...как то не очень похоже на оператора site:![]()
Лям запросов на Xevil меньше чем за сутки, запросы типа site:, правда ТОР10, не глубже
Проверил чисто на запросах без операторов гугла парсит норм...https://prnt.sc/wzm5jYChZ4ol... скорее всего на ближайшие месяцы пока жужель не попустит единственная альтернатива парсингу с операторами![]()
Лям запросов на Xevil меньше чем за сутки, запросы типа site:, правда ТОР10, не глубже
Скорее всего из за запросов вида site:... были бы другие... был бы антибот... и ляма бы не было... проверенно лично ... только палится и сразу зацикливает и не принимает капчу...плюс по скрину вижу запросы простые без операторов...Прозрачные эпоксидные смолы...как то не очень похоже на оператора site:
Дык я ужо сам)))... без операторов норм парситВот что за недоверчивость
"Прозрачные эпоксидные смолы site:domain.com" там было, для того чтоб определить какая страница ранжируется по этому запросу.
Какие другие запросы интересно проверить?
попробуй этиЯ к тому - какие операторы поставить
Готово: https://a-parser.com/threads/7507/Раз такое дело можете пожалуйста добавить Pages count значение 100
A-Parser - это профессиональная платформа для сбора данных промышленного масштаба: 10 000+ потоков, 110+ парсеров и гибкость Node.js. Автоматизируйте задачи в SEO, e-commerce и арбитраже трафика с непревзойденной скоростью и масштабируемостью
Нужна помощь с настройкой или работой парсера? Напишите в поддержку, поможем довести все до результата.
Написать в поддержку