JIS X 0201
Der JIS X 0201, entwickelt 1969, ist die erste japanische Zeichenkodierung, die breitere Anwendung gefunden hat. JIS steht für Japan Industrial Standard, das Gegenstück zur DIN. Der Zeichensatz ist eine Erweiterung des ASCII-Codes von sieben auf acht Bit. Dadurch stehen 128 weitere Schriftzeichen zur Verfügung. Das ist allerdings zu wenig, um das gesamte japanische Schriftsystem mit zwei Silbenschriften und mindestens 2.000 chinesischen Schriftzeichen aufzunehmen. Stattdessen wurde nur eine Silbenschrift implementiert, die Katakana, die bis dahin auch schon in Telegrammen als einzige Schrift zum Einsatz kam. Bereits wenige Jahre später, 1978, wurde dann mit dem JIS C 6226 der erste Schriftsatz auf der Basis von 16 Bit bzw. 2 Byte entwickelt, der mit seinen maximal 65.535 Zeichen eine Implementierung von Kanji ermöglichte. Auf der Basis des JIS C 6226 wurden dann die meisten heute gängigen Schriftsätze für Japanisch entwickelt wie Shift-JIS.
Probleme
Im JIS X 0201 übernahm an den Codepositionen 0 bis 127 die 7-Bit-Kodierung JIS-Roman, in der zwei Schriftzeichen Backslash (\) und Tilde (~) durch das Yen-Symbol (¥) und die Overline (¯) ersetzt worden waren. Das hat dazu geführt, dass auf japanischen Computern Pfadangaben unter DOS/Windows als C:¥Program Files¥
erscheinen.
Eine zweite Spätfolge des Schriftsatzes sind die Half-width-Katakana (Katakana halber Breite). Im JIS X 0201 werden die Katakana durch ein einzelnes Byte repräsentiert, und in den ersten Umsetzungen waren die Katakana auch nicht – wie bis dahin in der japanischen Schrift üblich – im Geviert dargestellt, sondern wie lateinische Buchstaben in halber Breite. In den nachfolgenden Zeichensätzen wurde ein neuer Full-width-Katakana-Block eingeführt, in dem die Katakana erstens zwei Byte belegten und zweitens die normale Breite hatten. Die meisten modernen Zeichenkodierungen enthalten beide Sätze.
Tabelle des ASCII-Erweiterungsbereichs
Hex A1 A2 A3 A4 A5 A6 A7 A8 A9 AA AB AC AD AE AF Dez 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 Zeichen 。 「 」 、 ・ ヲ ァ ィ ゥ ェ ォ ャ ュ ョ ッ Hex B0 B1 B2 B3 B4 B5 B6 B7 B8 B9 BA BB BC BD BE BF Dez 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 Zeichen ー ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソ Hex C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 CA CB CC CD CE CF Dez 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 Zeichen タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マ Hex D0 D1 D2 D3 D4 D5 D6 D7 D8 D9 DA DB DC DD DE DF Dez 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 Zeichen ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ン ゛ ゜
In der Tabelle nicht genannte Zeichen jenseits von 127 (7Fhex) sind nicht belegt.