Ошибка Яндекс выдача не соответствует реальной

  • Автор темы Автор темы Parsme
  • Дата начала Дата начала

Parsme

A-Parser Enterprise License
A-Parser Enterprise
Способ воспроизведения: при сборе топ-100 результатов в яндекс (регион Москва) на первых позициях часто "пролазят" сайты которых нет при ручной проверке с телефона/ноутбука. При этом, даже используя те же мобильные прокси в браузере - результаты кардинально различаются с тем, что отдает парсер на той же проксе.
Для теста, в браузер вбивал тот же урл, по которому стучится парсер в яндекс используя ту же прокси:
Код:
https://yandex.ru/search/?text=pokerdom+%D0%BB%D0%B8%D1%87%D0%BD%D1%8B%D0%B9+%D0%BA%D0%B0%D0%B1%D0%B8%D0%BD%D0%B5%D1%82&lr=213&search_source=yaru_desktop_common
4426

4427

Топ-10 результатов при ручной проверке (десктоп):

Код:
https://winline.ru/games/lottery
https://pokerdom014.buzz/
https://www.gipsyteam.ru/pokerrumy/pokerdom/lichnyi-kabinet
https://pokerdom-blog.icu/account
https://poker.ru/pokerdom-kak-zaregistrirovatsya/
https://t.me/s/galaxyhub_pokerdom/8/Official_Pokerdom_Pokerdom
https://winrating.ru/school/registraciya-v-pokerdom-podrobnaya-instrukciya-usloviya-bonusy
https://www.youtube.com/watch?v=QLRmlw4l0Dk
https://pokerdomzc.buzz/
https://pekarstas.com/pokerrooms/pokerdom/kabinet-pokerdom/

Топ-10 результатов пот парсера (десктоп):
Код:
https://pokerdom014.buzz/
https://www.gipsyteam.ru/pokerrumy/pokerdom/lichnyi-kabinet
https://dit7pokerdom.com/auth/login (нету при проверке)
https://pokerdom-blog.icu/account
https://pokerdom-login.biz/registration (нету при проверке)
https://pokerdom-hkj93.buzz/lichnyj-kabinet/ (нету при проверке)
https://pokerdom-rrc.top/ (нету при проверке)
https://pokerdomcasino-online.com/ (нету при проверке)
https://pokerdomzc.buzz/
https://pokerdom-tmf.top/ (нету при проверке)

P.s. причем, парсер часто отдает домены, которые забанены РКН, что в принципе невозможно - их не может быть в поисковой выдачи, пример: dit7pokerdom.com, pokerdom-login.biz, pokerdom-tmf.top, pokerdom-rrc.top, pokerdom-hkj93.buzz - все эти домены как раз и отсутствуют при ручной проверке...
4428

Файл результатов для пачки запросов: https://www.dropbox.com/scl/fi/e4pv...9-03.txt?rlkey=jw3rhs4ibto5tpjauj5fj54q1&dl=0

Код:
eJytV21T4zYQ/isaDQxHCSHhZXoNc+0Ahet1OEJ5+dCJqUex5aBGtlRJhoQc/70r
yY4dAkmudDKTsVa7z748q7U8wYboob5UVFOjcac3wdI94w6WJhyTLKajMNXDkMQ6
TJnWknKOG1gSpamyFj18fdrp/Ok0YSOmCcm5wY0JNmNJAUc8UKVYTGGTxRZXidFY
UaMY1SB7IDy3ah/x89s2uabOrNI3KqcLDJz2yT2NhlTVnKSizzhd5EmSAY1EnpnK
aneZn/lkfOGaKl/kitci223vLdC8NYyHR5lhn4mhYcFQ5S0iUgtOFvnKhJHAl8gI
Z080XrmOiVApMeDQcTr1uAbky6bf/LCxxlk2DIJsY3NRCIalVOR1lP3WIn06gojB
JjOEnxBponvylYxOZrnZXwAQ0wcW0Zq/mOqhEXIh/YomCVU0LjzeWLUKQeZPT4v7
R/A4JMDUAJiaI6ovDCf98lixFHqtjpUwbly7FvXu9LCtMwhsgfFdo9C48eqKAqtA
QHRfc/FXc8vDBwG0XxDs6FxKocwuPHLyCP/NLVAX0jCRgT7TS84d/DSo6pVbRkfH
SjxC4MDWJWRYPxczhOcZ+yenM+nClLEzRKSEZTZfr1LkC9QVO+XGZy76hBcR3d2V
SPrMNabtU9luehZ669voyxmCNcsS0dR5FEFihygwGn1CGm2h9iE6Pb8+taIEREkh
uvgVrd9Ng9TX5IHeCE9WFbs+g9UFSenCubm9FkNXWMPy6Gw2zcg2CIljZgkh3Ifu
B2sNSehIPM6AhZHv0DDyU65AeneevXVkNVuHyO62pkKWJAVAgg6Rlm6xgz44ySb6
AbVbLfQNlTNhvbmbbGwCiHQ+litC0NbFz+gAXKMAwzwJMAotQIg2NlyEhzaaGs+3
voPseIMg4dGO4TMlUtst1NXDCsdlP/TwmltXrfWHt8GdhHBNG1gDvWcEGIpf7jA4
eMQI1XUnB+QTLLIjzs/pA+WVmsM/zhmPYdweJWD0pTB8XaU7h/E8Ta/uCg7Zo4IY
pihuddz9WlnF4lwM7Jjru4mRMgNr7QdmB++1WiAeUiqnVbuwVUuFolNH9iBN3cOt
QNLMHumqz49kJZrJA4pb8VITTrAWuYIx3Om1Gi/mGRiYcpQN6OiKSk7cwCZKkbEd
JV7b7cLSTjOSUDOGhyD4JVf8U7lbjAg2cAKP08H3xsjOzg7IjD2yzqsdQK+FpDMG
uZnZqFKo+28m5fMxOcDS5i1MkkX3QPz3QBYmc4h+Mq4I6JVXwFs16Rrgmzm/HeGr
3Hr1itpvL6nUs1xuvyOj/zeA72c9hitl/F9Yf7s3l0Iu4WlVyPcwvwywzBosIpEl
bNAtrhLlNMmzG/g86WYnIpWc2uGX5Zw37LXkqnrvHuliVtvFdD7OGZ84Fy6s4hMF
ohBc/37tx5lUDII6aBQnoO61gIwI57dX5/Uda6jhYtLNTpV6MePd2wNLAS9nuLeg
IG/t7/Xd/0f7v/+je47ds5f/5JWI+2+5/3Zl4FX3DpzBLrbxGDoQ8DqDatkiFh9l
06+5Sf3TrDN5hnfE3/rSK9laWRWQQdG1uwy2n/8F8J+qJw==

Версия A-parser: Последняя 1.2.2927
ОС: Ubuntu 20.04.6 LTS, Release: 20.04

P.s.s. разметка SPOILER у вас не работает на форуме. Просто удаляет данные которые указал в спойлере - поэтому все засунул в code.
 

Вложения

  • IP.png
    IP.png
    62,6 КБ · Просмотры: 29
  • yandex.png
    yandex.png
    120,9 КБ · Просмотры: 30
  • RKN.png
    RKN.png
    90,2 КБ · Просмотры: 29
Последнее редактирование модератором:
стало интересно, чекнул, у меня такой проблемы нет
использую премиумные прокси апарсеры в работе
 
стало интересно, чекнул, у меня такой проблемы нет
использую премиумные прокси апарсеры в работе
Вот и хочу разобраться в чем проблема. Перепробовал все варианты тонких настроек в парсере - все равно лезут домены, которых нету в реальной выдаче... Нужна помощь саппорта.
p.s. у меня на премиальных прокси яндекс вообще не парсится - яндекс банит ip и все...
 
Сверять всегда нужно только в инкогнито и только на том же IP и с теми же настройками поиска. И в парсере, и в браузере должна быть чистая сессия. И даже при 100% повторении всех условий, позиции и/или выдача могут немного отличаться. Это нормально, особенно для Яндекса. Вариативность выдачи легко можно увидеть в браузере, если пару раз обновить страницу.

Но в целом больших отличий (при идентичных условиях) между парсером и браузером нету. Под спойлером скриншот, где видна выдача в браузере и выдача в парсере при 100% идентичных параметрах поиска.
upload_2025-9-4_12-6-35.png

парсер часто отдает домены, которые забанены РКН, что в принципе невозможно - их не может быть в поисковой выдачи, пример: dit7pokerdom.com, pokerdom-login.biz, pokerdom-tmf.top, pokerdom-rrc.top, pokerdom-hkj93.buzz
Тот факт, что перечисленные домены все же могут присутствовать в выдаче, виден на скриншоте выше.

разметка SPOILER у вас не работает на форуме
Вроде работает ;)
 
Сверять всегда нужно только в инкогнито и только на том же IP и с теми же настройками поиска. И в парсере, и в браузере должна быть чистая сессия. И даже при 100% повторении всех условий, позиции и/или выдача могут немного отличаться. Это нормально, особенно для Яндекса. Вариативность выдачи легко можно увидеть в браузере, если пару раз обновить страницу.

Но в целом больших отличий (при идентичных условиях) между парсером и браузером нету. Под спойлером скриншот, где видна выдача в браузере и выдача в парсере при 100% идентичных параметрах поиска.


Тот факт, что перечисленные домены все же могут присутствовать в выдаче, виден на скриншоте выше.


Вроде работает ;)
Проверял также, кроме режима инкогнито... Все равно, я вижу периодически расхождение (именно подтасовку странных доменов в результате съема в парсере, в остальном же выдача совпадает). Спасибо за помощь. Задачу закрываем, получается?
 
Назад
Верх