Обрезанная ссылка (в коце три точки ...)

  • Автор темы Автор темы creck
  • Дата начала Дата начала

creck

A-Parser Enterprise License
A-Parser Enterprise
Всем привет! Не пойму почему, но постоянно после парсинга выдачи, 20% ссылок записуются с точками в конце! Была бы не проблема, если бы эти точки были бы не перед зоной. Получается, что вместо, или до зон стоят три точки. Ссылка конечно же не будет работать, и никак не поймеш что за донор (((

Парсю всема всевозможными парсераи выдачи!
Вот небольшой список:
http://k2l.software.informer....
http://k2host.com.br.web-host...
http://popek2reviews.wordpres...
http://k2-photogrammetry.soft...
http://j-k2.software.informer...
http://legalsmokek2.blogetery...
http://www.angrysnowboarder.c...
http://2urk2nv.uponone.com/
http://karynk2.yelp.com/
http://www.pitch.com/
http://www.gearmarket.com/
http://www.languageinternatio...
http://www.avgthreatlabs.com/
http://w2ww.mumbaipropertyexc...
http://pakistank2.blogspot.com/
http://k2-solutions.software....
http://appexchange.salesforce...
http://k2car.net.cutestat.com/
http://weww.mumbaipropertyexc...
http://wdw.mumbaipropertyexch...
http://ww.mumbaipropertyexcha...
http://wsww.mumbaipropertyexc...
http://wwe.mumbaipropertyexch...
http://ns1.mumbaipropertyexch...
http://webmail.mumbaiproperty...
http://wwew.mumbaipropertyexc...
http://programs.mumbaipropert...
http://wwd.mumbaipropertyexch...

Ребята, пожалуйста подскажите куда копать? Спасибо!
 
Здравствуйте.
Ссылку на источник, откуда идет парсинг, можете указать?
 
Всем привет! Не пойму почему, но постоянно после парсинга выдачи, 20% ссылок записуются с точками в конце! Была бы не проблема, если бы эти точки были бы не перед зоной. Получается, что вместо, или до зон стоят три точки. Ссылка конечно же не будет работать, и никак не поймеш что за донор (((

Парсю всема всевозможными парсераи выдачи!
Вот небольшой список:
http://k2l.software.informer....
http://k2host.com.br.web-host...
http://popek2reviews.wordpres...
http://k2-photogrammetry.soft...
http://j-k2.software.informer...
http://legalsmokek2.blogetery...
http://www.angrysnowboarder.c...
http://2urk2nv.uponone.com/
http://karynk2.yelp.com/
http://www.pitch.com/
http://www.gearmarket.com/
http://www.languageinternatio...
http://www.avgthreatlabs.com/
http://w2ww.mumbaipropertyexc...
http://pakistank2.blogspot.com/
http://k2-solutions.software....
http://appexchange.salesforce...
http://k2car.net.cutestat.com/
http://weww.mumbaipropertyexc...
http://wdw.mumbaipropertyexch...
http://ww.mumbaipropertyexcha...
http://wsww.mumbaipropertyexc...
http://wwe.mumbaipropertyexch...
http://ns1.mumbaipropertyexch...
http://webmail.mumbaiproperty...
http://wwew.mumbaipropertyexc...
http://programs.mumbaipropert...
http://wwd.mumbaipropertyexch...

Ребята, пожалуйста подскажите куда копать? Спасибо!
Скорее всего это SE::Baidu так парсит, где то на форуме есть пресет как получить полные ссылки.
 
Парсю всема всевозможными парсераи выдачи!
Если проблема есть не только в парсере выдачи SE::Baidu - укажите запрос по которому появляется такая выдача, например в SE::Yandex. В любом случаи, подход к решению будет приблизительно таким, как описано в этом посте https://a-parser.com/resources/122/ , которую Вам указали выше - берем контент страницы и с помощью регулярных выражений получаем полные ссылки.
 
Назад
Верх