ISO 8859

ISO 8859
-1Latin-1, Westeuropäisch
-2Latin-2, Mitteleuropäisch
-3Latin-3, Südeuropäisch
-4Latin-4, Nordeuropäisch
-5Kyrillisch
-6Arabisch
-7Griechisch
-8Hebräisch
-9Latin-5, Türkisch
-10Latin-6, Nordisch
-11Thai
-12(existiert nicht)
-13Latin-7, Baltisch
-14Latin-8, Keltisch
-15Latin-9, Westeuropäisch
-16Latin-10, Südosteuropäisch

Die Normenfamilie ISO 8859, genauer ISO/IEC 8859, der Internationalen Organisation für Normung definiert in 15 verabschiedeten und einer verworfenen Teilnorm verschiedene 8-Bit-Zeichensätze für die Informationstechnik, darunter:

  • ISO 8859-1 war im Dezember 2020 mit 1,7 % die zweithäufigste Kodierung von Websites, nach UTF-8 mit 95,9 %.
  • ISO 8859-9 wird von 0,1 % aller Websites verwendet.
  • die übrigen Teilnormen spielen in der Praxis keine Rolle.[1]

Allgemeiner Aufbau der Zeichensätze

  • Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
  • Die Zeichen 7Fhex bis 9Fhex werden in der Norm nicht definiert ("Their use is outside the scope of ISO/IEC 8859; it is specified in other International Standards, for example ISO/IEC 6429.")[2]
  • Die letzten 96 Positionen (A0hex bis FFhex) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus. Sie sind unten in Tabellenform dargestellt. Die Zeichenzuordnung insbesondere von ISO 8859-1 spiegelt dabei den Aufbau von ASCII wider.
    • A0hex bis BFhex enthält hauptsächlich Satz- und Sonderzeichen.
    • C0hex bis DFhex enthält hauptsächlich Großbuchstaben.
    • E0hex bis FFhex enthält hauptsächlich Kleinbuchstaben.

Anmerkungen

  • Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
  • Der neuere Latin-9-Zeichensatz (ISO 8859-15) unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz; unter anderem wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
  • Innerhalb der Normenfamilie wurde kein Zeichensatz „ISO 8859-12“ festgelegt. Die Bezeichnung wurde vorübergehend für zwei verschiedene Vorschläge benutzt, aber keiner der beiden wurde als Standard beschlossen.
  • Die ISO-8859-Normen werden von ISO/IEC nicht mehr aktiv weiterentwickelt. Die Zeichensätze wurden durch ISO UCS abgelöst das inhaltsgleich zum Unicode-Standard ist. Dieser findet vor allem in Form der UTF-8-Kodierung Verbreitung.

Buchstaben für die deutsche Sprache

Die deutschen Umlaute Ä = C4hex, ä = E4hex, Ö = D6hex, ö = F6hex, Ü = DChex und ü = FChex sowie das kleine Eszett ß = DFhex sind in zehn Teilnormen der Latin-Gruppe jeweils auf den gleichen Positionen bzw. mit dem gleichen Code vorhanden. Eine Kompatibilität zwischen diesen Normen zumindest für deutschsprachige Texte ist damit gegeben.

Lediglich in den Teilnormen für die Alphabete -5 Kyrillisch, -6 Arabisch, -7 Griechisch, -8 Hebräisch und -11 Thai sind die deutschen Sonderzeichen nicht verfügbar.

Tabelle der regionalen Sonderzeichen

An Position A0hex liegt stets das geschützte Leerzeichen (engl. non breaking space, NBSP) und an ADhex meist der bedingte Trennstrich (engl. soft hyphen, SHY), der nur am Zeilenende sichtbar ist. Weitere mit Buchstaben symbolisierte Zeichen sind im Hebräischen die bidirektionalen Steuerzeichen LRM und RLM an Position FDhex bzw. FEhex. Leere Felder sind entweder (noch) nicht belegt oder können auf dem verwendeten System nicht angezeigt werden.

Ergänzungen und Änderungen in der Version 2003 des Standards.
Nicht definierte Zeichen sind grün hinterlegt.

Belegung der ISO-8859-Teilnormen mit regionalen Sonderzeichen
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
10100000240160A0NBSP
10100001241161A1¡ĄĦĄЁ  ¡Ą¡Ą
10100010242162A2¢˘˘ĸЂ ¢¢Ē¢¢ą
10100011243163A3£Ł£ŖЃ £££Ģ£££Ł
10100100244164A4¤¤¤¤Є¤¤¤Ī¤Ċ
10100101245165A5¥Ľ ĨЅ ¥¥Ĩċ¥
10100110246166A6¦ŚĤĻІ ¦¦¦Ķ¦ŠŠ
10100111247167A7§§§§Ї §§§§§§§§
10101000250168A8¨¨¨¨Ј ¨¨¨ĻØšš
10101001251169A9©ŠİŠЉ ©©©Đ©©©©
10101010252170AAªŞŞĒЊ ͺתŠŖªȘ
10101011253171AB«ŤĞĢЋ «««Ŧ«««
10101100254172AC¬ŹĴŦЌ،¬¬¬Ž¬¬Ź
10101101255173ADSHYSHY
10101110256174AE®Ž ŽЎ  ®®Ū®®®ź
10101111257175AF¯ŻŻ¯Џ ¯¯ŊÆŸ¯Ż
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
10110000260176B0°°°°А °°°°°°°
10110001261177B1±ąħąБ ±±±ą±±±
10110010262178B2²˛²˛В ²²²ē²Ġ²Č
10110011263179B3³ł³ŗГ ³³³ģ³ġ³ł
10110100264180B4´´´´Д ΄´´īŽŽ
10110101265181B5µľµĩЕ ΅µµĩµµ
10110110266182B6śĥļЖ Άķ
10110111267183B7·ˇ·ˇЗ ·······
10111000270184B8¸¸¸¸И Έ¸¸ļøžž
10111001271185B9¹šıšЙ Ή¹¹đ¹¹č
10111010272186BAºşşēК Ί÷ºšŗºș
10111011273187BB»ťğģЛ؛»»»ŧ»»»
10111100274188BC¼źĵŧМ Ό¼¼ž¼ŒŒ
10111101275189BD½˝½ŊН ½½½½œœ
10111110276190BE¾ž žО Ύ¾¾ū¾ŸŸ
10111111277191BF¿żżŋП؟Ώ ¿ŋæ¿ż
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11000000300192C0ÀŔÀĀР ΐ ÀĀĄÀÀÀ
11000001301193C1ÁÁÁÁСءΑ ÁÁĮÁÁÁ
11000010302194C2ÂÂÂÂТآΒ ÂÂĀÂÂÂ
11000011303195C3ÃĂ ÃУأΓ ÃÃĆÃÃĂ
11000100304196C4ÄÄÄÄФؤΔ ÄÄÄÄÄÄ
11000101305197C5ÅĹĊÅХإΕ ÅÅÅÅÅĆ
11000110306198C6ÆĆĈÆЦئΖ ÆÆĘÆÆÆ
11000111307199C7ÇÇÇĮЧاΗ ÇĮĒÇÇÇ
11001000310200C8ÈČÈČШبΘ ÈČČÈÈÈ
11001001311201C9ÉÉÉÉЩةΙ ÉÉÉÉÉÉ
11001010312202CAÊĘÊĘЪتΚ ÊĘŹÊÊÊ
11001011313203CBËËËËЫثΛ ËËĖËËË
11001100314204CCÌĚÌĖЬجΜ ÌĖĢÌÌÌ
11001101315205CDÍÍÍÍЭحΝ ÍÍĶÍÍÍ
11001110316206CEÎÎÎÎЮخΞ ÎÎĪÎÎÎ
11001111317207CFÏĎÏĪЯدΟ ÏÏĻÏÏÏ
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11010000320208D0ÐĐ ĐаذΠ ĞЊŴÐĐ
11010001321209D1ÑŃÑŅбرΡ ÑŅŃÑÑŃ
11010010322210D2ÒŇÒŌвز  ÒŌŅÒÒÒ
11010011323211D3ÓÓÓĶгسΣ ÓÓÓÓÓÓ
11010100324212D4ÔÔÔÔдشΤ ÔÔŌÔÔÔ
11010101325213D5ÕŐĠÕеصΥ ÕÕÕÕÕŐ
11010110326214D6ÖÖÖÖжضΦ ÖÖÖÖÖÖ
11010111327215D7××××зطΧ ×Ũ×׌
11011000330216D8ØŘĜØиظΨ ØØŲØØŰ
11011001331217D9ÙŮÙŲйعΩ ÙŲŁÙÙÙ
11011010332218DAÚÚÚÚкغΪ ÚÚŚÚÚÚ
11011011333219DBÛŰÛÛл Ϋ ÛÛ ŪÛÛÛ
11011100334220DCÜÜÜÜм ά ÜÜ ÜÜÜÜ
11011101335221DDÝÝŬŨн έ İÝ ŻÝÝĘ
11011110336222DEÞŢŜŪо ή ŞÞ ŽŶÞȚ
11011111337223DFßßßßп ίßß฿ßßßß
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11100000340224E0àŕàāрـΰאàāąààà
11100001341225E1ááááсفαבááįááá
11100010342226E2ââââтقβגââāâââ
11100011343227E3ãă ãуكγדããćããă
11100100344228E4ääääфلδהääääää
11100101345229E5åĺċåхمεוåååååć
11100110346230E6æćĉæцنζזææęæææ
11100111347231E7çççįчهηחçįēççç
11101000350232E8èčèčшوθטèččèèè
11101001351233E9ééééщىιיéééééé
11101010352234EAêęêęъيκךêęźêêê
11101011353235EBëëëëыًλכëëėëëë
11101100354236ECìěìėьٌμלìėģììì
11101101355237EDííííэٍνםííķííí
11101110356238EEîîîîюَξמîîīîîî
11101111357239EFïďïīяُοןïïļïïï
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11110000360240F0ðđ đِπנğðšŵðđ
11110001361241F1ñńñņёّρסñņńññń
11110010362242F2òňòōђْςעòōņòòò
11110011363243F3óóóķѓ σףóóóóóó
11110100364244F4ôôôôє τפôôōôôô
11110101365245F5õőġõѕ υץõõõõõő
11110110366246F6ööööі φצöööööö
11110111367247F7÷÷÷÷ї χק÷ũ÷÷ś
11111000370248F8øřĝøј ψרøøųøøű
11111001371249F9ùůùųљ ωשùųłùùù
11111010372250FAúúúúњ ϊתúúśúúú
11111011373251FBûűûûћ ϋ ûûūûûû
11111100374252FCüüüüќ ό üü üüüü
11111101375253FDýýŭũ§ ύLRMıý żýýę
11111110376254FEþţŝūў ώRLMşþ žŷþț
11111111377255FFÿ˙˙˙џ   ÿĸ ÿÿÿ
BinärOktDezHex-1-2-3-4-5-6-7-8-9-10-11-13-14-15-16

Siehe auch

Einzelnachweise

  1. https://w3techs.com/technologies/history_overview/character_encoding ISO 8859-2, und 8859-15 werden da noch erwähnt, mit (etwas?) weniger als 0,17 %.
  2. ISO/IEC 8859-1:1998, S. 5

Weblinks