JIS X 0201

Der JIS X 0201, entwickelt 1969, ist die erste japanische Zeichenkodierung, die breitere Anwendung gefunden hat. JIS steht für Japan Industrial Standard, das Gegenstück zur DIN. Der Zeichensatz ist eine Erweiterung des ASCII-Codes von sieben auf acht Bit. Dadurch stehen 128 weitere Schriftzeichen zur Verfügung. Das ist allerdings zu wenig, um das gesamte japanische Schriftsystem mit zwei Silbenschriften und mindestens 2.000 chinesischen Schriftzeichen aufzunehmen. Stattdessen wurde nur eine Silbenschrift implementiert, die Katakana, die bis dahin auch schon in Telegrammen als einzige Schrift zum Einsatz kam. Bereits wenige Jahre später, 1978, wurde dann mit dem JIS C 6226 der erste Schriftsatz auf der Basis von 16 Bit bzw. 2 Byte entwickelt, der mit seinen maximal 65.535 Zeichen eine Implementierung von Kanji ermöglichte. Auf der Basis des JIS C 6226 wurden dann die meisten heute gängigen Schriftsätze für Japanisch entwickelt wie Shift-JIS.

Probleme

Im JIS X 0201 übernahm an den Codepositionen 0 bis 127 die 7-Bit-Kodierung JIS-Roman, in der zwei Schriftzeichen Backslash (\) und Tilde (~) durch das Yen-Symbol (¥) und die Overline (¯) ersetzt worden waren. Das hat dazu geführt, dass auf japanischen Computern Pfadangaben unter DOS/Windows als C:¥Program Files¥ erscheinen.

Eine zweite Spätfolge des Schriftsatzes sind die Half-width-Katakana (Katakana halber Breite). Im JIS X 0201 werden die Katakana durch ein einzelnes Byte repräsentiert, und in den ersten Umsetzungen waren die Katakana auch nicht – wie bis dahin in der japanischen Schrift üblich – im Geviert dargestellt, sondern wie lateinische Buchstaben in halber Breite. In den nachfolgenden Zeichensätzen wurde ein neuer Full-width-Katakana-Block eingeführt, in dem die Katakana erstens zwei Byte belegten und zweitens die normale Breite hatten. Die meisten modernen Zeichenkodierungen enthalten beide Sätze.

Tabelle des ASCII-Erweiterungsbereichs

HexA1A2A3A4A5A6A7A8A9AAABACADAEAF
Dez161162163164165166167168169170171172173174175
Zeichen
HexB0B1B2B3B4B5B6B7B8B9BABBBCBDBEBF
Dez176177178179180181182183184185186187188189190191
Zeichen
HexC0C1C2C3C4C5C6C7C8C9CACBCCCDCECF
Dez192193194195196197198199200201202203204205206207
Zeichen
HexD0D1D2D3D4D5D6D7D8D9DADBDCDDDEDF
Dez208209210211212213214215216217218219220221222223
Zeichen

In der Tabelle nicht genannte Zeichen jenseits von 127 (7Fhex) sind nicht belegt.