1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Ошибка [1.2.428] SE::Yandex::Images некорректная выдача

Тема в разделе "1.2.434", создана пользователем unixwz, 27 фев 2019.

  1. unixwz

    unixwz New Member

    Регистрация:
    26 окт 2018
    Сообщения:
    1
    Симпатии:
    0
    Здравствуйте. Столкнулся с следующей проблемой. При ручном поиске в Яндекс.Картинки мы видим следующие результаты по запросу "Манифест" - https://imgur.com/a/Zwh2KHR , однако если спарсить выдачу через парсер SE::Yandex::Images по идентичному запросу мы получим совершенно иные результаты https://imgur.com/a/3TLoKPT , вот ссылки которые были получены в результате работы парсера:

    https://ae01.alicdn.com/kf/HTB1dgglpgoQMeJjy0Fpq6ATxpXaK/2017-holstee.jpg_q50.jpg
    https://i.ytimg.com/vi/DaSvGFBZYSI/maxresdefault.jpg
    https://www.proza.ru/pics/2019/02/21/462.jpg
    https://is04.infourok.ru/img/12fe-0007c7a5-abcc2b65.jpg
    http://900igr.net/up/datas/109712/009.jpg
    http://present5.com/presentation/62839353_455634982/image-28.jpg
    http://5klass.net/datas/obschestvoznanie/Istorija-prinjatija-Konstitutsii/0009-009-Manifest-Nikolaja-II.jpg
    https://cf.ppt-online.org/files/slide/n/Nt4JICnd0MlcZoGPRz8DKOgyj1b5VeLWkBm9Yp/slide-26.jpg
    http://900igr.net/up/datas/69383/009.jpg
    https://libmir.com/i/97/322697/cover.jpg
    https://ic.pics.livejournal.com/arisot/71755492/30689/30689_900.jpg
    http://900igr.net/up/datas/107177/002.jpg
    https://files.serials.today/uploads/image/file/4c/78/4a/xxl_fc3f227146ac4346.jpg
    https://cf.ppt-online.org/files/slide/6/6RNr3ktOvdDupVjn1mUX8B75wLcAgKSas0ZYPx/slide-24.jpg
    https://ds04.infourok.ru/uploads/ex/00df/000b999e-c91add48/640/img3.jpg
    http://900igr.net/up/datas/175809/049.jpg
    https://img2.wbstatic.net/big/new/3490000/3499932-1.jpg
    https://i.ytimg.com/vi/kqG7hOFMs_U/maxresdefault.jpg
    https://pp.userapi.com/c845120/v845120226/1afac9/IKF0jUBxUjs.jpg
    https://pp.userapi.com/c851524/v851524364/c17ee/6Sk61t5QBlA.jpg
    https://gazetemanifesto.com/wp-content/uploads/2019/02/hamide-yigit-gazete-manifesto.jpg
    https://ae01.alicdn.com/kf/HTB1p89jljihSKJjy0Ffq6zGzFXak/2017-holstee.jpg_q50.jpg
    https://scontent.cdninstagram.com/vp/cd8888bfa68eb5bdf88b025fdaef9a90/5CF41BF7/t51.2885-19/45414526_2326432397389585_1868957840647913472_n.jpg?_nc_ht=instagram.ffra1-1.fna.fbcdn.net
    http://900igr.net/up/datas/206945/010.jpg
    http://900igr.net/up/datas/190965/023.jpg
    https://cf.ppt-online.org/files1/slide/g/grxdBhqQ4T9bYXAj1yJakGKlDORtc0EF2iwzu83ZL/slide-19.jpg
    http://fantasticbook.ru/pict/1016112370.jpg
    https://cf.ppt-online.org/files1/slide/b/bzDuN8klt3QwFXef5KmR4yOGW7xVn6iJajqI29PvgL/slide-19.jpg
    https://xn----7sblqwdegk2n.xn--p1ai/uploads/posts/2018-10/1539637136_0_1b9e4c_f3a6b15_xl.jpg
    https://ds02.infourok.ru/uploads/ex/0d2a/00018041-55f365bf/640/img16.jpg

    Картинки которые были получены парсером совершенно не соответствуют первым результатам выдачи при ручном поиске.

    При общение с поддержкой A-Parser в telegram нам удалось установить, что возможно проблема из-за того, что парсер по какой-то причине парсит результаты не с первой страницы и действительно в логе парсинга можно наблюдать следующую ссылку:
    Код:
    https://yandex.ru/images/search?format=json&request={"blocks":[{"params":{"initialPageNum":0},"block":"serp-list_infinite_yes","version":2},{"params":{},"block":"more_direction_next","version":2}]}&p=1&text=Манифест&rpt=image
    По моему предположению параметр p=1 в этой ссылке как рак указывает на страницу и если предположить, что нумерация страниц в Яндекс начинается с 0, то этим всё объясняется и полагаю, что это нужно исправить.

    В подтверждение моей теории я могу предоставить следующие факты. При ручном поиске можно также указать параметр p и вот, что вы видим в итоге:
    - первый запрос параметр p=1 - https://imgur.com/a/XdgK0TF тут во первых мы видим результаты второй страницы, а во вторых видим кнопку, которая предлагает показать нам предыдущие результаты.
    - второй запрос параметр p=0 - https://imgur.com/a/Gp3brXw тут мы видим, что результаты для первой страницы, а также отсутствие кнопки показать предыдущие результаты, что в свою очередь свидетельствует о том, что нумерация страниц в Яндекс.Картинки начинается с 0, а также о том, что парсер SE::Yandex::Images парсит результаты с параметром p=1, что указывает на вторую страницу, соответственно получаем результаты второй страницы и несоответствие выдачи при ручном поиске и парсинге.

    Также предоставляю вам мои настройки для SE::Yandex::Images в которых изменен только один параметр - количество страниц для парсинга - https://imgur.com/a/PqBfSSZ
     

Поделиться этой страницей