Нужно напарсить сниппетов (с гугла и яндекса) и очистить их от html. В результате получить "один сниппет - одна строка". Желательно тут же спарсить и сниппеты с рекламных объявлений. Как настроить такое задание?
&..; это не теги, это html сущности, для них надо использовать Decode HTML Entities о каких разных формах урлов речь?
(IMG:http://s58.radikal.ru/i159/0807/14/11a41d564de8t.jpg) 9 июня 2008 http://www.technisat.com/download/en/soft/1664.dvb.4.4.3.zip http://www.technotrend.com/english/download/download.html. А программу, http://www.skygrabber.com/drivers/ttBudget2_5.0.1.8.zip и... Техническая спецификация (eng): http://www.technotrend.ru/download/TechSpec_TT-budget_20S-1401.pdf. http://www.free-x.de/wiki/index.php/DVB-S_Budget-PCI-Card http://manna-project.net/index.php?a...details&f_id=1 http://www.technisat.com/index6be4.h...,en,33&pID=174 SkyStar 2 V 2.8 Export RC Set IR USB http://www.technisat.com/indexfa....7896986 www.technotrend.com. URL Разработчика: www.r-tt.com. www.lissyara.su —>
по твоему скрину ты парсишь только сниппеты, если там попадаются урлы то это значит что это часть сниппета, и то как он выводиться целиком и полностью зависит от Яндекса
этот результат не от того задания которое на скрине, т.к. в результате выведен титл - урл - сниппет, а не просто сниппет, и очевидно хтмл теги встречаются только в титле
конечно не от того..что на скрине. я же просто так вообще зашел в эту ветку . То..что имя файла результата отличается от того, что в настрйоках объясняется тем, что парсинг я запустил утром..а скрин сделал с тех же настроек вечером. имя файла только другое сохранено в профиле. Такая же херь парсится из быстрого задания. .точно такой же результат в файле.
причем тут имя файла? я вижу явное не соответствие задания и его результата в задании ты выводишь только сниппеты, а результат смотришь совсем от другого задания, в котором в результат выводиться титл - урл - сниппет, сниппет очищен от тегов, а титл как раз нет