[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: сравнение кодировок: таблица



Eugene Osintsev <osgene@omskelecom.ru> wrote:

>Не Бог весть какая польза от таких таблиц, но всё-таки. Сильно не
>пинайте, работы полно, чиркнул на лету...
>
>                        KOI8-R  CP1251  ISO-8859-5
>Стандарт de facto       +       -       -
>Любовь "буржуев"        -       -       +
>Полиграф. символы       -       +       -
>Многонациональность     -       +       +
>7-бит. читабельность    +       -       -
>Г с чубом               -       +       -

 В свое время далалась попытка некого исследования
использования Charset-ов в Росии (по-моему в ru.internet.providers).
Насколько я помню :

Plain Text (.TXT)                        -  IBM-866   95%
.DOC                                       -  Windows-1251  99.9%
Имена файлов на диске и SMB     -   IBM-866   95% UTF-8 3%
E-mail                                        - KOI8-R   85% Windows-1251 12%
NNTP                                         - KOI8-R 90%
WWW                                        - Windows-1251 70%  KOI8-R 25%


 Так что с переходом на "единую и неделимую" кодировку
придется повременить. Ситуация такова, что в России
ИСПОЛЬЗУЕТСЯ  НЕСКОЛЬКО КОДИРОВОК ОДНОВРЕМЕННО.
Если хотя бы эту простую мысль донести до буржуев, стало
бы заметно легче.

 Отсюда два простых вывода :

- ВСЕГДА использовать только полную форму locale в России :
LANG=ru_RU.KOI8-R или там LANG=ru_RU.CP1251 e.t.c. и
никаких сокращений "ru" или "ru_RU".

- ВСЕГДА проставлять MIME Charset в e-mail, NNTP
и заголовках HTTP. Без Charset-а -- считать это Latin-1.


--
-=AV=-