Всем привет! Не пойму почему, но постоянно после парсинга выдачи, 20% ссылок записуются с точками в конце! Была бы не проблема, если бы эти точки были бы не перед зоной. Получается, что вместо, или до зон стоят три точки. Ссылка конечно же не будет работать, и никак не поймеш что за донор ((( Парсю всема всевозможными парсераи выдачи! Вот небольшой список: http://k2l.software.informer.... http://k2host.com.br.web-host... http://popek2reviews.wordpres... http://k2-photogrammetry.soft... http://j-k2.software.informer... http://legalsmokek2.blogetery... http://www.angrysnowboarder.c... http://2urk2nv.uponone.com/ http://karynk2.yelp.com/ http://www.pitch.com/ http://www.gearmarket.com/ http://www.languageinternatio... http://www.avgthreatlabs.com/ http://w2ww.mumbaipropertyexc... http://pakistank2.blogspot.com/ http://k2-solutions.software.... http://appexchange.salesforce... http://k2car.net.cutestat.com/ http://weww.mumbaipropertyexc... http://wdw.mumbaipropertyexch... http://ww.mumbaipropertyexcha... http://wsww.mumbaipropertyexc... http://wwe.mumbaipropertyexch... http://ns1.mumbaipropertyexch... http://webmail.mumbaiproperty... http://wwew.mumbaipropertyexc... http://programs.mumbaipropert... http://wwd.mumbaipropertyexch... Ребята, пожалуйста подскажите куда копать? Спасибо!
Если проблема есть не только в парсере выдачи SE::Baidu - укажите запрос по которому появляется такая выдача, например в SE::Yandex. В любом случаи, подход к решению будет приблизительно таким, как описано в этом посте https://a-parser.com/resources/122/ , которую Вам указали выше - берем контент страницы и с помощью регулярных выражений получаем полные ссылки.