[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: sort & locale



>> Опять же, есть некая неопределенность POSIX : sort потребляет
>> stdin, который есть просто поток байтов. Каких байтов ? В какой
>> кодировке ? ISO ? KOI ? А если это UNICODE в UTF-8 или вообще
>> в UCS-2 ?
>
>Интересный вопрос. Принадлежность символов к определенному алфавиту (не
>кодировке!) _должна_ быть известна при вводе! При вводе посредством xkb
>(правильном) это известно.


 Что имеется в виду под термином "алфавит" ? Атрибут текста "language" ?
Или Character Set ?

 В принципе, свое видение проблемы я изложил в
http://www.sensi.org/~alec/locale/locale_io.html

 Это такая мягкая критика POSIX (и UNIX/DOS/WIN вообще) с их идеей
файла (хранилища данных) - как плоской последовательности байтов.
Никаких тебе ЕА и ресурсных вилок. И ввести их _нельзя_, т.к. разрушится
идея stdin/stdout .

 Кстати, в HTTP видна некая борьба старых plain идей с
современными требованиями : я имею в виду механизмы
handhake по контенту/языку/transfer-encoding-у.


>> Ошибочная locale появилась в glibc из RedHat 5.x .
>
>Александр, а в locale где ошибка? Не в названии, а в самой locale ru_RU?


 Ошибка в locale ru_RU в названии месяцев, вернее в разных падежах.
Января;Февраля;Март;Апреля;Май;Июня;Июля;Августа;Сентября;Октября;Ноября;Дек
абря

 IMHO, надо все первести в именительный.

===================
comment_char %
escape_char  /
repertoiremap mnemonic.ds
%
% Russian Language Locale for Russia
% Source: RAP
% Address: Sankt Jo//rgens Alle 8
%    DK-1615 Ko//benhavn V, Danmark
% Contact: Keld Simonsen
% Email: Keld.Simonsen@dkuug.dk
% Tel: +45 - 31226543
% Fax: +45 - 33256543
% Language: ru
% Territory: RU
% Revision: 4.3
% Date: 1996-10-15
% Application: general
% Users: general
% Repertoiremap: mnemonic.ds
% Charset: ISO-8859-5
% Distribution and use is free, also
% for commercial purposes.
...
LC_TIME
...
mon     "<JA><n=><v=><a=><r=><ja>";/
        "<F=><e=><v=><r=><a=><l=><ja>";/
        "<M=><a=><r=><t=>";/
        "<A=><p=><r=><e=><l=><ja>";/
        "<M=><a=><j=>";/
        "<I=><ju><n=><ja>";/
        "<I=><ju><l=><ja>";/
        "<A=><v=><g=><u=><s=><t=><a=>";/
        "<S=><e=><n=><t=><ja><b=><r=><ja>";/
        "<O=><k=><t=><ja><b=><r=><ja>";/
        "<N=><o=><ja><b=><r=><ja>";/
        "<D=><e=><k=><a=><b=><r=><ja>"
...

--
-=AV=-