а именно атрибут encoding, пользуюсь dom парсером. SAX парсером можно распарсить этот кусок, но это затруднит работу всего приложение. В общем у кого какие идеи?<?xml version="1.0" encoding="windows-1251"?>
XML encoding
XML encoding
В общем проблема в кодировках в xml-файле. Приложение качает xml но кодировка в нём может быть любой. Как прочитать вот этот кусок xml'а:
R.id.team
Политика на форуме запрещена
Политика на форуме запрещена
Re: XML encoding
вроде нашёл решение тута http://www.javatalks.ru/ftopic25331.php ... l+encoding завтра его проверю, если кто то до завтра даст ответ то от меня спасибо =)
R.id.team
Политика на форуме запрещена
Политика на форуме запрещена
Re: XML encoding
что то помогло но частично:
более половины xml-документов читает нормально, но не 100%.
Код: Выделить всё
InputSource is = new InputSource(new StringReader(content));
is.setEncoding(is.getEncoding());
builder = factory.newDocumentBuilder();
doc = builder.parse(is);
R.id.team
Политика на форуме запрещена
Политика на форуме запрещена
Re: XML encoding
никто не откликается -(
Возник ещё такой вопрос: качаю xml, распарсиваю, там кадировка windows-1251, делаю setEncoding("windows-1251"), для уверенности пишу в лог getEncoding - возврящает windows-1251, но в TextView отображаются иэроглифы, и даже если укажу UTF-8, как с этим быть? С xml которые парсятся в UTF-8 проблем нету, а с windows-1251 одни иэроглифы.
Возник ещё такой вопрос: качаю xml, распарсиваю, там кадировка windows-1251, делаю setEncoding("windows-1251"), для уверенности пишу в лог getEncoding - возврящает windows-1251, но в TextView отображаются иэроглифы, и даже если укажу UTF-8, как с этим быть? С xml которые парсятся в UTF-8 проблем нету, а с windows-1251 одни иэроглифы.
R.id.team
Политика на форуме запрещена
Политика на форуме запрещена
-
- Сообщения: 3
- Зарегистрирован: 05 июл 2012, 12:49
Re: XML encoding
Вполне возможен вариант, что у Вас все проходит правильно, просто контент отображается не в правильных кодировках. И покажите пожалуйтста пример XML и символами, которые парсятся в неправильной кодировке у Вас.rezak90 писал(а):никто не откликается -(
Возник ещё такой вопрос: качаю xml, распарсиваю, там кадировка windows-1251, делаю setEncoding("windows-1251"), для уверенности пишу в лог getEncoding - возврящает windows-1251, но в TextView отображаются иэроглифы, и даже если укажу UTF-8, как с этим быть? С xml которые парсятся в UTF-8 проблем нету, а с windows-1251 одни иэроглифы.
Re: XML encoding
Ну как Вы собираетесь парсить саксом? Если бы это было бы возможно, можно было бы начать парсить саксом до определения кодировки. отстановить парсинг и начать парсинг домом, зная кодировку.rezak90 писал(а):В общем проблема в кодировках в xml-файле. Приложение качает xml но кодировка в нём может быть любой. Как прочитать вот этот кусок xml'а:а именно атрибут encoding, пользуюсь dom парсером. SAX парсером можно распарсить этот кусок, но это затруднит работу всего приложение. В общем у кого какие идеи?<?xml version="1.0" encoding="windows-1251"?>
Но сакс не отчитывается о чтении заголовка:
Кроме того, автоматическое определение кодировки при разборе саксом работает в обычной яве, но не в андроиде: http://forum.vingrad.ru/forum/topic-386130.htmlA SAX parser must never report an XML declaration