[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: сравнение кодировок: таблица



>  В свое время далалась попытка некого исследования
> использования Charset-ов в Росии (по-моему в ru.internet.providers).
> Насколько я помню :
> 
> Plain Text (.TXT)                        -  IBM-866   95%
Где ?????
> .DOC                                       -  Windows-1251  99.9%
> Имена файлов на диске и SMB     -   IBM-866   95% UTF-8 3%
А вот это что значит??????
> E-mail                                        - KOI8-R   85% Windows-1251 12%
> NNTP                                         - KOI8-R 90%
> WWW                                        - Windows-1251 70%  KOI8-R 25%
А это весьма не точно, так как на половине серверов стоит apache-rus,
а значит он отдает, то что требует клиент (не вдаваясь в подробности как).

Статистика очень странная, но с выводами согласен.

>  Так что с переходом на "единую и неделимую" кодировку
> придется повременить. Ситуация такова, что в России
> ИСПОЛЬЗУЕТСЯ  НЕСКОЛЬКО КОДИРОВОК ОДНОВРЕМЕННО.
Да, это факт

> Если хотя бы эту простую мысль донести до буржуев, стало
> бы заметно легче.
> 
>  Отсюда два простых вывода :
> 
> - ВСЕГДА использовать только полную форму locale в России :
> LANG=ru_RU.KOI8-R или там LANG=ru_RU.CP1251 e.t.c. и
> никаких сокращений "ru" или "ru_RU".
> 
> - ВСЕГДА проставлять MIME Charset в e-mail, NNTP
> и заголовках HTTP. Без Charset-а -- считать это Latin-1.
Это не пройдет. Как ты сам пишешь на sensi.org, это stream и 
charset undefined.


-- 

                      С наилучшими пожеланиями, Евгений Бырганов.
                      Best regards, Eugene Byrganov.

  mailto:E.B.Byrganov@inp.nsk.su
  work - http://www.inp.nsk.su/