KOI8-U

KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung.

KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig.

KOI-U ist beschrieben in RFC 2319 und ist IANA-registriert und für MIME zugelassen.

Tabelle

…0…1…2…3…4…5…6…7…8…9…A…B…C…D…E…F
0…ungenutzt
1…
2…SP!"#$%&'()*+,-./
3… 0 123456789:;<=>?
4…@ABCDEFGHIJKLMNO
5…PQRSTUVWXYZ[\]^_
6…`abcdefghijklmno
7…pqrstuvwxyz{|}~
8…
9…NBSP°²·÷
A…ёєіїґ
B…ЁЄІЇҐ©
C…юабцдефгхийклмно
D…пярстужвьызшэщчъ
E…ЮАБЦДЕФГХИЙКЛМНО
F…ПЯРСТУЖВЬЫЗШЭЩЧЪ

Die Unterschiede zu KOI8-R sind an den Positionen A4hex, A6hex, A7hex, ADhex und B4hex, B6hex, B7hex, BDhex (in obiger Tabelle farblich hervorgehoben), wo die vier zusätzlich benötigten Buchstaben kodiert sind.

Während RFC 2319 sagt, dass 95hex Unicode U+2219 (∙) sein soll, wird es oft in U+2022 (•) umgesetzt, wegen der Kompatibilität mit Codepage 1251. Einige Referenzen haben einen Tippfehler und ordnen fehlerhafterweise B4hex U+0403 zu, anstatt des korrekten U+0404. Dieser Tippfehler ist auch im Anhang A von RFC 2319, aber die Tabelle im Haupttext ist korrekt.

Siehe auch

Weblinks