8.3

8.3, auch 8-Punkt-3-Namen und retronym short name(s) für kurze Dateinamen genannt, ist eine häufig verwendete Schreibweise, die die historische Beschränkung von acht Zeichen für den Dateinamen und drei Zeichen für die Dateinamenserweiterung beschreibt. Diese Beschränkung ist in den Betriebssystemen CP/M von Digital Research (ab ca. 1974)[1] und davon abgeleiteten PC-kompatiblen Disk Operating Systemen (ab 1980) ebenso zu finden wie im File Allocation Table (FAT), einem ursprünglich 1977 von Microsoft für BASIC entwickelten Dateisystem, das später über 86-DOS auch in MS-DOS übernommen wurde.

Durch die große Verbreitung von MS-DOS und Windows in den 1980er und 1990er Jahren war 8.3 lange Zeit die vorherrschende Konvention für Dateinamen und galt auch darüber hinaus bis in die 2000er Jahre als Industriestandard für den Datenaustausch zwischen den Plattformen.[2] Erst mit der LFN-Erweiterung durch VFAT (LFN steht für Long File Name, VFAT für Virtual File Allocation Table), die mit Windows 95 und Windows NT 3.5 Mitte der 1990er Jahre eingeführt wurde, konnte die 8.3-Beschränkung bei Systemen, die auf dem FAT-Dateisystem basieren, aufgehoben werden.

Geschichte

Beim Betriebssystem CP/M, das Mitte der 1970er für Computer für die 8-Bit-Prozessoren Intel 8080 und Zilog Z80 entwickelt wurde, orientierte sich dessen Entwickler Gary Kildall an den Konventionen des Betriebssystems TOPS-10 für die DEC PDP-10.[3] Viele Systeme der späten 1960er und frühen 1970er Jahre hatten ein Limit von sechs[4] oder acht Zeichen für den Dateinamen. Auch gab es auf vielen dieser Systeme bereits eine Dateinamenserweiterung, die auf drei Zeichen beschränkt war.[5] Inspiriert vom 6.3-Limit von TOPS-10[6] nutzt das Dateisystem von CP/M daher eine 8.3-Konvention.

Ab 1978 war mit dem 8086 der erste 16-Bit-Prozessor von Intel verfügbar, gefolgt von dessen voll kompatiblem kleineren Bruder 8088 ab 1979. Als der Nachfolger des 8-Bit-8080 waren ihm der 16-Bit-8086 bzw. -8088 so ähnlich, dass Assembler-Code meist mit nur wenigen kleinen Anpassungen neu übersetzt werden konnte; 8080-Binärcode war jedoch nicht kompatibel. Das Interesse am neuen 16-Bit-Prozessor war zwar groß, doch gab es keine kompatible Version des damals bereits verbreiteten Betriebssystems CP/M. 1980 schließlich begann der Entwickler Tim Paterson von Seattle Computer Products mit der Entwicklung eines nahezu identischen Systems namens QDOS, für „quick and dirty operating system“, das zwar keine 8-Bit-Programme ausführen konnte, CP/M jedoch in großen Teilen nachempfunden war. Als Dateisystem wählte Tim Petterson den bereits von Microsoft BASIC verwendeten File Allocation Table, der wie das Dateisystem von CP/M auch die 8.3-Konvention verwendete.

Durch den weiteren Verlauf der Geschichte wurde mit jedem IBM-PC ab 1981 dieses 86-DOS genannte Betriebssystem als IBM PC DOS ausgeliefert, das Microsoft inzwischen gekauft hatte und das als MS-DOS zum Industriestandard auf allen IBM-PC-kompatiblen Computern der 1980er und frühen 1990er Jahre werden sollte. Mit CP/M-86 kam 1982 zwar CP/M endlich ebenfalls auf den 16-Bit-Prozessor des IBM-PC, war aber teurer als MS-DOS/PC DOS und konnte sich nicht mehr durchsetzen. Als Weiterentwicklung von CP/M besetzte in den späten 1980er und frühen 1990er Jahren jedoch das zu MS-DOS kompatible DR DOS von Digital Research (später Novell DOS und schließlich wieder DR-DOS) eine kleine Nische im Markt der IBM-PC-kompatiblen Computer.

Aufgrund des großen Erfolgs des IBM-PC-Designs und der zahlreichen dazu kompatiblen Computer wurde FAT zum Industriestandard für den Datenaustausch mit anderen Systemen. Eine Vielzahl von Geräten, die einen Datenspeicher nutzen, verwenden ebenfalls FAT und sind somit von der 8.3-Beschränkung bzw. deren Implementierung in VFAT betroffen.[2]

Konvention

8.3 bedeutet, dass das Dateisystem bei Datei- und Verzeichnisnamen auf höchstens acht Buchstaben oder Ziffern, gefolgt von einem Punkt („.“) und der Namenserweiterung, die aus maximal drei Zeichen bestehen darf, limitiert ist. Bei der Verarbeitung der Datei- und Verzeichnisnamen wird dabei nicht zwischen Groß- und Kleinschreibung unterschieden. Ein 8.3-Dateisystem ist daher case-insensitive. Kleinbuchstaben werden dazu vom Betriebssystem in Großbuchstaben umgewandelt, im Dateisystem sind Kleinbuchstaben dadurch prinzipiell unzulässig. Weiterhin sind einige Sonderzeichen unzulässig, die unter CP/M und MS-DOS als Steuerzeichen reserviert sind (z. B. Doppelpunkt, Fragezeichen, Stern) oder in unterschiedlichen Codepages unterschiedlich belegt sind, bspw. ist der Pfadbegrenzer in Deutschland (Codepage 850) der Backslash („\“) und in Japan (Codepage 932) das Yen-Symbol („¥“), obwohl ihre Dateisystem-interne Kodierung identisch ist.

Kurze Dateinamen

Mit Windows 95 und Windows NT 3.5 wurde VFAT als Variante des FAT-Dateisystems mit erweiterten Verzeichniseinträgen eingeführt. Damit wurden längere, groß- und kleinbuchstabig geschriebene Dateinamen als sog. „Long File Names“ (abgekürzt LFN) zusätzlich zum 8.3-Schema auch in der MS-DOS- und Windows-„Welt“ möglich. Die Schreibweise wird jedoch weiterhin vom Betriebssystem unabhängig von der Groß- und Kleinschreibung akzeptiert, sodass auch VFAT weiterhin case-insensitive ist, jedoch auch case-preserving, die bei der Erstellung einer Datei verwendete Schreibweise also erhält. Dies ist für die Abwärtskompatibilität mit bestehender Software notwendig.

Ebenfalls der Abwärtskompatibilität geschuldet wird für jeden langen Dateinamen zusätzlich eine klassische 8.3-Variante im Verzeichnis eingetragen, unter der ältere Programme mit derartigen Dateien umgehen können. Diese nun doppelten Einträge werden retronym auch short (file) names, deutsch kurze Dateinamen, genannt. Sie betreffen dabei nicht nur das FAT-Dateisystem, mit VFAT auf den Varianten FAT12, FAT16 und FAT32, sondern auch das modernere NTFS.[7]

Unter Windows wird hierzu folgendermaßen vorgegangen:

  1. Wenn der Dateiname bereits nur aus Großbuchstaben bzw. Ziffern im 8.3-Schema besteht, wird keine LFN-Variante erzeugt.
    Beispiel: TEXTFILE.TXT
  2. Wenn der Dateiname zwar dem 8.3-Schema entspricht, aber Groß- und Kleinbuchstaben enthält, wird dies als LFN gespeichert, während zusätzlich eine großgeschriebene 8.3-Variante (short name) erzeugt wird.
    Beispiel: TextFile.Txt wird zusätzlich als TEXTFILE.TXT registriert.
  3. Sonstige Dateinamen werden als LFN gespeichert und zusätzlich wird eine 8.3-Variante, genannt short name für „kurzer Dateiname“, registriert. Da beide Einträge auf dieselben Daten verweisen, entspricht dies einer harten Verknüpfung, die jedoch automatisch vom Betriebssystem bzw. Dateisystem-Treiber verwaltet wird. Es gibt daher keine Möglichkeit, in diesen Vorgang einzugreifen. Der kurze Dateiname besteht aus den ersten 6 Zeichen des Dateinamens in Großbuchstaben, erweitert um eine Tilde („~“) und eine fortlaufende Ziffer, gefolgt vom Punkt und den ersten drei großgeschriebenen Zeichen der Namenserweiterung.
    Beispiel a): TextFile1.Mine.txt wird zu TEXTFI~1.TXT (oder TEXTFI~2.TXT, falls TEXTFI~1.TXT bereits existiert).
    Beispiel b): WordFile1.docx wird zu WORDFI~1.DOC (oder WORDFI~2.DOC, falls WORDFI~1.DOC bereits existiert).
  4. Wenn die vorangehenden Methoden nicht zu einem eindeutigen 8.3-Dateinamen führen, wird der lange Dateiname (LFN) auf zwei Zeichen gekürzt, gefolgt von einer zufälligen 4-stelligen Hexadezimalzahl, der wiederum eine Tilde samt Ziffer folgt und woran anschließend die Namenserweiterung angehängt wird.
    Beispiel: TextFile.Mine.txt könnte zu TE021F~1.TXT werden.

Auch auf anderen Betriebssystemen ist diese Funktion oft vorhanden, kann aber teilweise auch beeinflusst werden. Unter Betriebssystemen, die traditionell eher die Kleinschreibung bevorzugen wie etwa Unix und Unix-artige Betriebssysteme, gibt es daher auch oft die Möglichkeit, 8.3-Dateien für den Zugriff automatisch in die Kleinschreibung umzuwandeln, obwohl sie der 8.3-Konvention folgend im Dateisystem in Großbuchstaben abgespeichert sind. Dies macht bei der unter Unix üblichen case-sensitiven Nutzung einen wesentlichen Unterschied, denn dadurch ist z. B. FILENAME.TXT nur als filename.txt ansprechbar. Unter Linux kann das genaue Verhalten für den Dateisystemtreiber vfat durch verschiedene Mount-Optionen festgelegt werden: Die Konvertierung der Großbuchstaben bei 8.3-Dateinamen in die entsprechende Kleinschreibung ist über den Parameter shortname einstellbar, und für die bei LFN automatisch erzeugten kurzen Dateinamen ermöglicht die Option nonumtail, dass diese nach Möglichkeit einfach nach den ersten acht Zeichen abgeschnitten werden. Damit würde LangerDateiname.txt zu LANGERDA.TXT, falls dieser 8.3-Name noch verfügbar ist, bevor LANGER~1.TXT versucht wird.

Auf allen Betriebssystemen werden die kurzen 8.3-Namen bei Dateioperationen in jedem Verzeichnis neu generiert. Da dies transparent und automatisch passiert, kann es bei mehreren ähnlichen Dateinamen zu einer veränderten Nummerierung beim kurzen Dateinamen aufgrund der Reihenfolge der Abarbeitung kommen, z. B. wenn Dateien kopiert oder verschoben werden. Beispiel: Es wird zuerst Meine Datei.txt erstellt, welche den Kurznamen MEINED~1.TXT erhält. Danach wird Meine Daten.txt erstellt, welche MEINED~2.TXT erhält. Wird die zweite Datei als erstes in ein neues Verzeichnis kopiert oder verschoben, erhält Meine Daten.txt den Kurznamen MEINED~1.TXT und die als zweite kopierte Meine Datei.txt den Kurznamen MEINED~2.TXT. Für den Anwender ist bei den allermeisten automatischen Dateioperationen, z. B. wenn mehrere Dateien markiert und kopiert oder verschoben werden, die Reihenfolge der Abarbeitung generell unvorhersehbar.

Probleme können entstehen wenn Dateien ihren langen Dateinamen verloren haben (beispielsweise Bearbeitung mit alten Programmen, Weitergabe über nicht kompatible Systeme) und eine LFN-Datei mit diesem Namen als Kurznamen schon existiert. Dann wird gefragt ob die Datei überschrieben werden soll. Dies kann auch passieren, wenn beide Dateien vorher friedlich in einem gemeinsamen Verzeichnis existierten. Beispiel: In einem Verzeichnis existiert bereits die Datei MEINED~1.TXT. Dazu kommt eine Datei mit dem Namen Meine Datei.txt, welche automatisch den Kurznamen MEINED~2.TXT erhält, da „~1“ schon vergeben ist. Wird jetzt in der Abarbeitungsreihenfolge zuerst Meine Datei.txt bewegt (weil beispielsweise nach Dateidatum abgearbeitet wird) erhält sie den Namen MEINED~1.TXT. Bei der nachher bewegten MEINED~1.TXT, welche nur diesen und keinen langen Dateinamen hat, wird dann festgestellt, dass der Dateiname schon vergeben ist. Gefährlich ist es nun in einer grafischen Dateioperation, wenn der Benutzer kurzerhand auf „Überschreiben“ klickt, denn damit geht eine der beiden Dateien verloren (wird im Endresultat beim Verschieben gelöscht).

Das NTFS-Dateisystem der Windows-NT-basierten Windows-Versionen unterstützt ebenfalls das LFN-System, es werden daher auch immer kurze Dateinamen im 8.3-Schema automatisch erstellt, was ebenfalls der Abwärtskompatibilität geschuldet war. Dies kann jedoch deaktiviert werden, u. a. zwecks Erhöhung der Abarbeitungsgeschwindigkeit.[8] Auf den Nachfolge-Dateisystemen exFAT und ReFS wird das LFN-System nicht mehr unterstützt, für MS-DOS gibt es hingegen DOSLFN.[9]

Das von CDs genutzte Dateisystem ISO 9660 erlaubt zwar Dateinamen mit bis zu 31 Zeichen, allerdings wurde früher aus Kompatibilitätsgründen von vielen Brennprogrammen auch hier das 8.3-Namensschema genutzt.

Einzelnachweise

  1. W. Craig Chambers: OS/2 LAN Server Certification Handbook. New Riders Pub., 1995, ISBN 978-1-56205-406-9, S. 299 (englisch, eingeschränkte Vorschau in der Google-Buchsuche): “Commonly known as the "8.3 convention," this naming structure originally was introduced by the CP/M operating system developed for the very early home computers.”
  2. a b Jörg Luther: Weg mit dem FAT. In: LinuxUser 05/2009. Computec Media, 1. Mai 2009, abgerufen am 18. Februar 2021: „Tatsächlich kommt man an FAT kaum vorbei, besitzt man irgendein Gerät oder Gadget, das Dateien auf einem Wechselmedium speichert. Die Industrie hat das von Microsoft entwickelte Dateisystem millionenfach in Systemen implementiert, als so genannten Industriestandard…“
  3. Scott Mueller, Brian Knittel: Upgrading and Repairing Microsoft Windows. Que, 2005, ISBN 978-0-7897-3403-7, S. 25 (englisch, eingeschränkte Vorschau in der Google-Buchsuche): “The 8.3 filename structure (eight character filenames with a three character extension), which derived from the 1970s TOPS-10 operating system and was copied by CP/M and then MS-DOS…”
  4. Craig A. Finseth: The Craft of Text Editing: Emacs for the Modern World. Springer Science & Business Media, 2012, S. 181 (englisch, eingeschränkte Vorschau in der Google-Buchsuche): “…PDP-10s running ITS (the Incompatible Timesharing System) … that system's file name syntax.  DEV;DIR:PRTONE PRTTWO  Each part can be up to 6 characters long…”
  5. Raphael A. Finkel: An Operating Systems Vade Mecum. Prentice Hall, 1988, S. 198 (englisch, eingeschränkte Vorschau in der Google-Buchsuche): “The first component has six or eight characters and the second has three.”
  6. DECsystem-10: Getting Started With TOPS-10 Commands. (PDF; 2,4 MiB) 2.0 Files. In: DEC-10-0TSCA-A-D. Digital Equipment Corporation, Juni 1975, S. 4, abgerufen am 19. Oktober 2021 (englisch): „Filenames are from one to six letters or digits. All letters or digits after the sixth are ignored. The filename extension is from one to three letters or digits. It is generally used to indicate the type of information in the file.“
  7. Naming Files, Paths, and Namespaces – Short vs. Long Names. In: Windows Developer. Microsoft, abgerufen am 18. Februar 2021 (englisch): „A long file name is considered to be any file name that exceeds the short MS-DOS (also called 8.3) style naming convention. When you create a long file name, Windows may also create a short 8.3 form of the name, called the 8.3 alias or short name, and store it on disk also.“
  8. support.microsoft.com: Deaktivieren der 8.3-Dateinamenerstellung auf NTFS-Partitionen
  9. https://www-user.tu-chemnitz.de/~heha/hsn/dos/doslfn/what_lfn.de.htm