Создаем в Редакторе простое задание: выбираем HTML::TextExtractor и указываем запрос http://news.rambler.ru/world/31781134/. Запускаем Task Tester. Видим такую картину:
Detect charset on content проблему не решает:
Меняем формат результата из дефолтного на $data. Запускаем Task Tester. В процессе выполнения задания видим такую картину. Сначала отображаются крякозябры, а через секунду уже нормальные символы:
Через секунду:
Но формат результата ведь был задан $data. Т.е. должен быть выведен исходный код страницы. И он есть в результате... но ниже:
Получается, что вывелся прошлый результат (уже в нормальном виде) плюс новый результат.
Добавляем Конструктор результатов и выводим его результат, но ситуация повторяется: выводится старый результат плюс новый (уже без крякозябров):
Detect charset on content проблему не решает:
Меняем формат результата из дефолтного на $data. Запускаем Task Tester. В процессе выполнения задания видим такую картину. Сначала отображаются крякозябры, а через секунду уже нормальные символы:
Через секунду:
Но формат результата ведь был задан $data. Т.е. должен быть выведен исходный код страницы. И он есть в результате... но ниже:
Получается, что вывелся прошлый результат (уже в нормальном виде) плюс новый результат.
Добавляем Конструктор результатов и выводим его результат, но ситуация повторяется: выводится старый результат плюс новый (уже без крякозябров):