1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Ошибка [1.2.773] Добавить возможность обработки линков в SE::Google::Images

Тема в разделе "1.2.799", создана пользователем DeLaKroiX, 16 фев 2020.

  1. DeLaKroiX

    DeLaKroiX A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 дек 2015
    Сообщения:
    267
    Симпатии:
    96
    При парсинге линков на картинки с гугла столкнулся с тем, что линки с punycode-доменов парсятся в таком вот извращённом виде:

    https://www.experimentosparani%C3%B1os.org//
    https://fx%E3%82%A8%E3%83%B3%E3%83%9A%E3%83%A9%E3%83%BC.jp//
    https://%E4%BB%AE%E6%83%B3%E9%80%9A%E8%B2%A8%E6%8A%95%E8%B3%87%E6%A1%88%E5%86%85%E6%89%80.com//

    По два слеша в конце оставлено специально, а то форум применяет к линкам urldecode и они отображаются не в том виде, в котором парсятся.


    Считаю целесообразным внести рацпредложение :) Вобщем было бы неплохо добавить возможность обработки линков до нормального состояния тем, кому это необходимо. Просто сделать выпадающую менюшку, где можно будет выбрать либо "Urldecode" либо "Urldecode+Punycode", как-то так. Или можно добавить эти функции в конструктор результатов, так будет ещё проще, можно будет к любому парсеру применить, если гугл или ещё какой поисковик и в обычных выдачах такое же выдают(не проверял).
    Это необходимо, чтобы не допиливать потом всё это руками перед тем, как засунуть в какой-либо софт.
     
    #1 DeLaKroiX, 16 фев 2020
    Последнее редактирование модератором: 17 фев 2020
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Исправлено
     
    DeLaKroiX нравится это.

Поделиться этой страницей