Добрый день. Помогите пожалуйста с настройкой данного парсера, чтобы имея список ключевых слов, можно было из выдачи Googl-а парсить текста из <body></body> Спасибо.
Прочитал темы настроил по тому как описано в этой теме http://a-parser.com/threads/1573/ Но результат не тот что бы хотелось. Надо сделать так что бы он не парсил значение %,@ (ну или вообще не парсил символы), не парсил значения из таблиц , не парсил домены-например в тексте прописан домен "домен.ком" и т.д. добавить как то в исключения доменные зоны. И парсил только предложения а по одному слову не парсил. Прикрепил файл того текста что получается у меня.
слишком много "надо", все решается регулярными выражением, вот пример очистки текста из другого топика: http://a-parser.com/threads/525/page-2#post-4570