Привет.
При сохранении в файл текста в UTF используя Net::HTTP парсер, двухбайтные символы сохраняются как 1 байтовые.
При этом если задачу прогонять через тест, то в окне парсера все выводится нормально.
Вот пример таска на парсинг городов на немецком языке с википедии:
Вместо Nürnberg при сохранении в файл получаем Nьrnberg и т.п.
Может я чего то не знаю \ не нашел? )
При сохранении в файл текста в UTF используя Net::HTTP парсер, двухбайтные символы сохраняются как 1 байтовые.
При этом если задачу прогонять через тест, то в окне парсера все выводится нормально.
Вот пример таска на парсинг городов на немецком языке с википедии:
Код:
eyJwcmVzZXQiOiJXaWtpIFBhcnNlciIsInZhbHVlIjp7InBhcnNlcnMiOltbIk5l
dDo6SFRUUCIsIk5vIFByb3h5Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoicXVl
cnlmb3JtYXQiLCJ2YWx1ZSI6Imh0dHA6Ly9kZS53aWtpcGVkaWEub3JnL3dpa2kv
TGlzdGVfZGVyX1N0JUMzJUE0ZHRlX2luX0RldXRzY2hsYW5kIn0seyJ0eXBlIjoi
Y3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPGRkPjxhIGhy
ZWY9XCIoW15cIl0rKVwiW14+XSs+KFtePF0rKTwvYT5cXHMqXFwoKC4rKVxcKTwv
ZGQ+IiwicmVnZXhUeXBlIjoiZyIsInJlc3VsdFR5cGUiOiJhcnJheSIsImFycmF5
TmFtZSI6ImNpdGllcyIsInJlc3VsdHMiOlsibGluayIsImNpdHkiLCJyZWdpb24i
XX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVl
IjoiY2l0aWVzW3tsaW5rfSx7Y2l0eX0se3JlZ2lvbn1cXG5dIn1dXSwicmVzdWx0
c0Zvcm1hdCI6InBhcnNlcjEoe3ByZXNldH0pIiwicmVzdWx0c1NhdmVUbyI6ImZp
bGUiLCJyZXN1bHRzRmlsZU5hbWUiOiJ7ZGF0ZX1fe3RpbWV9LnR4dCIsInJlc3Vs
dHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0Ijoie3F1ZXJ5fSIsInVuaXF1ZVF1
ZXJpZXMiOmZhbHNlLCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6Ik5vIiwibW9y
ZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIsInJlc3VsdHNBcHBl
bmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwi
Y29uZmlnT3ZlcnJpZGVzIjpbXX19
Вместо Nürnberg при сохранении в файл получаем Nьrnberg и т.п.
Может я чего то не знаю \ не нашел? )