[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Fwd: NEW charset!!! Было: Re: KOI8]

"LK" == Leon Kanter writes:

 >> Я надеюсь что сообщество поможет мне в этом, поддержит
 >> обсуждение. Я полагаю что новый чарсет уже назрел. И сейчас,
 >> обсуждая locale в GLIB2.1, речь идет, не об koi8-r, а об 'koi8
 >> with yo'. Может кто распивая пиво с ache убедит его внести
 >> изменения в koi8-r.
 LK> Полностью согласен, что досовскую псевдографику нужно напрочь
 LK> вынести и заменить спецсимволами из Latin1.

на всякий пожарный форваржу сюда письмо, если кто-то его не видел.

по повожу кодировок koi8-r и их расширений: вероятно, если делать
расширение (уделать псевдографику и заменять на кириллицу), то следует
постараться держать совместимость с iso-ir-111 (ECMA Cyrillic
codepage) и "KOI8 with CRL/NMSU extensions for SerboCroat", о которой
можно получить информацию из


From: Vladimir Volovich <vvv@vvv.vsu.ru>
Subject: [bit.listserv.rustex-l] Proposal: fonts and encoding for old Russian spelling
Newsgroups: fido.ru.unix
Date: 01 Sep 1999 21:26:42 +0400


тут недавно обсуждался вариант расширения кодировки koi8-r.  вот один
товарищ также предлагает это сделать. так что комментарии welcome:

====== forwarded message ======
From: Serge Winitzki <swinitzk@HOTMAIL.COM>
Message-ID:  <19990901101740.89880.qmail@hotmail.com>
Newsgroups:   bit.listserv.rustex-l
Date:         Wed, 1 Sep 1999 03:17:39 PDT
Subject:      Proposal: fonts and encoding for old Russian spelling


I was interested some time ago to work with a 20th century text written in
old Russian spelling, i.e. with the letters Yat', Fita, and I s tochkoj
(Izhitsa i Psi seemed to have died out already in 19th century). I made a
Net search and found that there is apparently no standard to encode these
characters and no 8 bit fonts that contain them.

I have therefore made an addition to the KOI-8 character set, putting the
three most needed extra letters (izhitsa, fita, yat', Izhitsa, Fita, Yat')
at hexacedimal positions 8D, 8E, 8F, 9D, 9E, 9F, and prepared the
corresponding keyboard maps and screen fonts suitable for X window system
which I am using (under most Unix-like operating systems), based on the
standard Cyrillic fonts distribution from XFree86. I have chosen these
hexadecimal values because they seemed to be unused in KOI-8, ECMA-111, and
ISO-8858-5 character sets, while in the "Windows" encoding these codes are
used by non-letter characters and so may be sacrificed too.

I also tentatively added all ISO-8859-5 characters to the KOI-8 character
set at positions consistent with the ECMA-111 encoding (which regrettably
*almost* had but never became an accepted ISO standard) and I propose to
call this the "KOI8-C" encoding, C for "Cyrillic". I have made two Unix
screen fonts and a pair of crude Type 1 and True Type fonts for that
encoding, one of them on the basis of the free courier-type font, the other
based on a commercial.

I would appreciate any comments about this work. I have not yet made a Web
page with this material although I may if there is interest.