[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [Fwd: NEW charset!!! Было: Re: KOI8]
Alexander Voropay wrote:
>
>
>
> А в KSI все было по другому : там под хорошо известным
> именем "KOI8-R" выступал совсем другой charset, с другими
> значениями codepoints. А это никуда не годится.
Да, но сделано это потому, что честно вводить новую кодировку было влом.
Поэтому опасность введения новый коёв как раз в том, что это приводит к
эрозии KOI8-R. А каковы последствия это -- лучше не думать.
>
> >Переходить на 1251. По крайней мере в тех приложениях, в которых нужен
> >EURO. Это не так сложно, но требует создания небольшой группы
> >единомышленников, которые будут патчить все библиотки, работающие с
> >кодировками. Если заодно добавить 1250, то восточноевропейцы будут нам
> >благодарны. Криков будет много, так как это шаг по пути свободы выбора,
> >а не по Unix way.
>
> Настоящая свобода выбора была бы в том случае, если у нас
> была бы возможность *свободно* выбирать *любую* кодировку.
> А если ее нет на локальной системе -- возможность быстро ее
> *подключить*. Собственно, POSIX locale почти так и работает :
> см. утилиту localedef.
>
> А самый писк был бы в том случае, если при поступлении
> документа в незнакомой кодировке система ходила бы в
> репозиторий и динамически незаметно нам бы эту раскладку
> подкачивала. Сама. :-) Но можно и ручками...
>
> К сожалению, X-ы не содержат такой возможности *расширения*.
> Собственно, на этом, мне кажется, и надо сосредоточить усилия.
> Разработать механизм динамического подключения любых кодировок.
> Тогда и Windows-1251 и Windows-1250 и любые User Defined
> подключались бы легко. А нам осталось бы только написать
> файлики с раскладкой. Типа xlocaledef.
Да.
>
> А лучше сделать X-ы полностью UNICODE. И не UTF-8, а
> настоящий UCS-2. Хватит таскать I18N через игольное ушко
> 8-ми битного байта. Долой char, даешь wchar_t ! ;-)
Да.
>
> >> P.S. Кстати, побочный результат моей командировки в г.Сыктывкар:
> >> Язык Коми - национальный язык РК (Республика Коми).
> >Неужели Билл не придумал для них кодировки?
>
> Если честно, не знаю. Газеты-то как-то выпускают ?
>
> > Вот для татар -- придумал!
>
> А какой у татар CP ? Не турецкий ли ?
Нет, они пишут модифицированной кириллицей. По-крайней мере, Шаймиев :-)
>
>
> Ну, пройдет лет 10 и привет. Мне нередко приходится общаться
> с эстонцами, мужики лет 30. Вполне нормальные мужики.
> Русского они просто не знают. Не из за национализма. Просто
> в школе плохо русский учили :-) Общаемся на кривом английском.
> 10 лет уж прошло с независимости Эстонии.
Да. Но белорусский вымрет вряд ли, а вот коми -- запросто.
Проблема в том, что не на кого опереться. Я расчитывал на местные LUG'и,
но им все до лампочки. Единственный варинат -- подключить к этому делу
лингвистов.
AEN.