[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: сравнение кодировок: таблица
> В свое время далалась попытка некого исследования
> использования Charset-ов в Росии (по-моему в ru.internet.providers).
> Насколько я помню :
>
> Plain Text (.TXT) - IBM-866 95%
Где ?????
> .DOC - Windows-1251 99.9%
> Имена файлов на диске и SMB - IBM-866 95% UTF-8 3%
А вот это что значит??????
> E-mail - KOI8-R 85% Windows-1251 12%
> NNTP - KOI8-R 90%
> WWW - Windows-1251 70% KOI8-R 25%
А это весьма не точно, так как на половине серверов стоит apache-rus,
а значит он отдает, то что требует клиент (не вдаваясь в подробности как).
Статистика очень странная, но с выводами согласен.
> Так что с переходом на "единую и неделимую" кодировку
> придется повременить. Ситуация такова, что в России
> ИСПОЛЬЗУЕТСЯ НЕСКОЛЬКО КОДИРОВОК ОДНОВРЕМЕННО.
Да, это факт
> Если хотя бы эту простую мысль донести до буржуев, стало
> бы заметно легче.
>
> Отсюда два простых вывода :
>
> - ВСЕГДА использовать только полную форму locale в России :
> LANG=ru_RU.KOI8-R или там LANG=ru_RU.CP1251 e.t.c. и
> никаких сокращений "ru" или "ru_RU".
>
> - ВСЕГДА проставлять MIME Charset в e-mail, NNTP
> и заголовках HTTP. Без Charset-а -- считать это Latin-1.
Это не пройдет. Как ты сам пишешь на sensi.org, это stream и
charset undefined.
--
С наилучшими пожеланиями, Евгений Бырганов.
Best regards, Eugene Byrganov.
mailto:E.B.Byrganov@inp.nsk.su
work - http://www.inp.nsk.su/