Nexus (Bioinformatik)
Das Nexus-Format ist ein in der systematischen Biologie und Bioinformatik weit verbreitetes Dateiformat, das in mehreren Computerprogrammen zur Stammbaumanalyse Anwendung findet.
Syntax
Nexus-Dateien sind Textdateien, die ein modulares Format aufweisen: Neben obligatorischen Blöcken können optionale Blöcke Informationen und Befehle für bestimmte Anwendungen enthalten. Jeder Block beginnt mit der Zeile BEGIN BlockName;
und endet mit der Zeile END;
. Sinnabschnitte innerhalb eines Blocks werden mit ;
getrennt. Text zwischen eckigen Klammern wird als Kommentar aufgefasst und damit ignoriert. Die erste Zeile muss #NEXUS
lauten.
Ein Beispiel für eine einfache Nexus-Datei mit einem Sequenzalignment ist:
#NEXUS BEGIN data;[eröffnet den "Data"-Block] Dimensions ntax=4 nchar=15; [Definiert die Größe des Alignments] Format datatype=dna missing=? gap=-; [Definiert den Datentyp (DNA) und Symbole für fehlende Daten (?) und gaps (-)] Matrix [hier beginnt das Alignment...] Species1 atgctagctagctcg Species2 atgcta??tag-tag Species3 atgttagctag-tgg Species4 atgttagctag-tag ; [...und hier endet es] END; [beendet den "Data"-Block]
Quellen
- D. R. Maddison, D. L. Swofford, W. P. Maddison: NEXUS: An extensible file format for systematic information. In: Systematic Biology. Band 46, Nr. 4, 1997, S. 590–621, doi:10.1093/sysbio/46.4.590.
- Detaillierter Artikel über das NEXUS-Format mit einer Liste von Schlüsselwörtern (englisch)