[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

MultiByte (WAS: "Поподробнее об XLC_LOCALE")



>>JIS явно имеет свое "длинное" представление. Кириллица там (если не
>ошибаюсь) имеет коды 07**, греческий - 06**.

>
> Кстати интересный вопрос, покажут ли MSIE и NN кириллицу из JIS ? ;-)
>Иероглифы и кану они показывают замечательно.


 Вот. Сделал четыре HTML файла в разных MultiByte кодировках :
- JIS
- Shift-JIS
- EUC
- UTF-8

 Первые два символа  U+6587 и U+5B57 - "символ" по японски,
потом слово "character", потом слово "символ" - 6 букв в кириллице.
Кодировки HTML проставлены через META.

 Все они показываются MSIE 4.01 нормально, и кириллица тоже.

 Однако, оказывается JIS и ISO-2022-JP -- это одно и то же.
Не знал. Там прямо ESC-последовательности в тексте и стоят :
Esc$B -- начало и Esc(B -- конец. Так что получается,
чистый JIS, он же ISO-2022-JP передавать через e-mail нельзя.
Если только в Base64.

 Не нашел способа сгенерировать UTF-7.

 Есть еще одна разновидность JIS, с однобайтовой каной > 0xa0 .
Тоже не знаю, как генерится и как называется.


P.S. Японско-английский и англо-японский словарики живут на:
http://dictionary.goo.ne.jp/je/
http://dictionary.goo.ne.jp/ej/
Странички там в кодировке EUC, URL-и передаются тоже в
EUC с %%, так что на обычном русском MSIE 4 с японскими
шрифтами все работает. Без шрифтов японские символы
отобразятся квадратиками. А MSIE 5 предложит самоустановить
поддержку японского языка. :-)
Русско-японского словаря в on-line не нашел. ;-(

--
-=AV=-

Ch.zip