Подскажите, как можно очистить файл или может перепарсить заново.. Нужны только Польские ключевики, а оно еще в добавок напарсило и английских.. как убрать английские?
А по каким признакам можно отличить польские от английских слов (кроме знания языка, естественно)? P.S. Если парсить подсказки в Гугле с указанным языком (например, польским), то при начальном польском запросе в результате все или почти все польское. Если же запрос изначально не польский, то и в результате польского не будет или будет мало. P.P.S. Отфильтровать полученный результат можно с помощью сервисов, которые определяют язык, например переводчиков. Вот готовый парсер, который легко можно переделать на определение языка слов вместо страниц: https://a-parser.com/resources/24/
Вот готовое решение: https://a-parser.com/resources/141/ Используйте фильтр по нужному языку, чтобы отфильтровать ключевые слова только на нужном языке: