[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: сравнение кодировок: таблица
Eugene Osintsev <osgene@omskelecom.ru> wrote:
>Не Бог весть какая польза от таких таблиц, но всё-таки. Сильно не
>пинайте, работы полно, чиркнул на лету...
>
> KOI8-R CP1251 ISO-8859-5
>Стандарт de facto + - -
>Любовь "буржуев" - - +
>Полиграф. символы - + -
>Многонациональность - + +
>7-бит. читабельность + - -
>Г с чубом - + -
В свое время далалась попытка некого исследования
использования Charset-ов в Росии (по-моему в ru.internet.providers).
Насколько я помню :
Plain Text (.TXT) - IBM-866 95%
.DOC - Windows-1251 99.9%
Имена файлов на диске и SMB - IBM-866 95% UTF-8 3%
E-mail - KOI8-R 85% Windows-1251 12%
NNTP - KOI8-R 90%
WWW - Windows-1251 70% KOI8-R 25%
Так что с переходом на "единую и неделимую" кодировку
придется повременить. Ситуация такова, что в России
ИСПОЛЬЗУЕТСЯ НЕСКОЛЬКО КОДИРОВОК ОДНОВРЕМЕННО.
Если хотя бы эту простую мысль донести до буржуев, стало
бы заметно легче.
Отсюда два простых вывода :
- ВСЕГДА использовать только полную форму locale в России :
LANG=ru_RU.KOI8-R или там LANG=ru_RU.CP1251 e.t.c. и
никаких сокращений "ru" или "ru_RU".
- ВСЕГДА проставлять MIME Charset в e-mail, NNTP
и заголовках HTTP. Без Charset-а -- считать это Latin-1.
--
-=AV=-