dazed
Гуру форума
- Регистрация
- 31 Мар 2007
- Сообщения
- 208
- Реакции
- 54
Здесь несколько вариантов решения, либо смотреть на хэдеры посылаемые от сервера (Content-Type: text/xml; charset=xxx), хэдеры html страницы (<meta http-equiv="Content-Type" content="text/html; charset=xxx">) или же пробовать через автоанализатор кодировки.Хочу поднять еще одну тему для уникального прасера. Для уникального парсера стоит задача перевода произвольной кодировки latin, iso, koi8r, windows и т.д. в одну единственную, например в utf-8.
Вот как победить эту проблему? Есть ли готовый велосипед?
Любой из этих методов часто дает сбой, подходить нужно комплексно и всеравно чтобы была возможность указывать кодировку вручную!