Ошибка [1.2.773] Добавить возможность обработки линков в SE::Google::Images

DeLaKroiX

A-Parser Enterprise License
A-Parser Enterprise
При парсинге линков на картинки с гугла столкнулся с тем, что линки с punycode-доменов парсятся в таком вот извращённом виде:

https://www.experimentosparani%C3%B1os.org//
https://fx%E3%82%A8%E3%83%B3%E3%83%9A%E3%83%A9%E3%83%BC.jp//
https://%E4%BB%AE%E6%83%B3%E9%80%9A%E8%B2%A8%E6%8A%95%E8%B3%87%E6%A1%88%E5%86%85%E6%89%80.com//

По два слеша в конце оставлено специально, а то форум применяет к линкам urldecode и они отображаются не в том виде, в котором парсятся.


Считаю целесообразным внести рацпредложение :) Вобщем было бы неплохо добавить возможность обработки линков до нормального состояния тем, кому это необходимо. Просто сделать выпадающую менюшку, где можно будет выбрать либо "Urldecode" либо "Urldecode+Punycode", как-то так. Или можно добавить эти функции в конструктор результатов, так будет ещё проще, можно будет к любому парсеру применить, если гугл или ещё какой поисковик и в обычных выдачах такое же выдают(не проверял).
Это необходимо, чтобы не допиливать потом всё это руками перед тем, как засунуть в какой-либо софт.
 
Последнее редактирование модератором:
Назад
Верх