Urliste

Die Urliste, auch Beobachtungsreihe genannt, ist im Bereich der Statistik das direkte Ergebnis einer Datenerhebung, also die ursprüngliche Aufzeichnung der Beobachtungs- oder Messwerte. Die Werte in der Urliste sind noch nicht weiter verrechnet worden, bis auf die Übersetzung der Wahrnehmungen in Zahlen durch die Messung. Deshalb bezeichnet man den einzelnen Wert als Urwert[1] und alle Urwerte zusammen als Urdaten,[1] Primärdaten[2] oder Rohdaten.[2] Zusätzlich zu diesen Merkmalswerten können auch Hinweise darauf aufgelistet werden, welchem Merkmalsträger die Merkmalswerte zugeordnet sind.[1] Sind die Werte in ihrer Reihenfolge zufällig oder entsprechend ihrer zeitlichen Abfolge der Beobachtung aufgelistet, handelt es sich um eine unsortierte Urliste. Richtet sich die Reihung nach irgendeiner Ordnung, dann liegt eine sortierte Urliste (auch primäre Tafel[3][4]) vor. Eine mögliche Ordnung wäre die alphabetische Ordnung der Merkmalsträger[1] oder die Ordnung nach der Größe der Merkmalsausprägung in einem der erfassten Merkmalsbereiche.

Die Kennzeichnung des Merkmalsträgers kann sowohl bei der Urliste[5] als auch bei der primären Tafel[4] entfallen. Es folgen Beispiele mit und ohne diese Kennzeichnung der Merkmalsträger.

Beispiel

Beispiel einer unsortierten Urliste:

MerkmalsträgerKinderzahl
Max Mustermann1
Frederik Schwein0
Bea Beispielfrau2
Piggeldy Schwein0
1020

Beispiel einer primären Tafel:

MerkmalsträgerKinderzahl
Frederik Schwein0
Piggeldy Schwein0
Max Mustermann1
Bea Beispielfrau2
0012

Die Merkmalsträger werden häufig mit einer Kennziffer bezeichnet. Diese Kennziffern der ungeordneten Urliste können in der geordneten Urliste der Reihe nach neu vergeben werden. Es wird vorgeschlagen, diese Änderung der Ziffern kenntlich zu machen, indem man sie in Klammern setzt.[6]

Unsortierte Urliste:

MerkmalsträgerKinderzahl
11
20
32
40

Primäre Tafel:

MerkmalsträgerKinderzahl
(1)0
(2)0
(3)1
(4)2

Vor- und Nachteile

Die Urliste enthält alle Beobachtungswerte und damit keine Auslassungen, Übertragungsfehler oder verlorene Information (Vorteile). Andererseits können Urlisten in der Praxis tausende oder millionen von Datensätzen enthalten, die für sich genommen unübersichtlich und nicht auswertbar sind; außerdem können bei einer unkorrigierten Urliste noch offensichtliche Fehler wie Zahlendreher oder unmögliche Daten enthalten sein (Nachteile).

Die Daten einer Urliste müssen in der Praxis also aufbereitet werden, um ihren Zweck zu erfüllen. Das geschieht meist durch das Bilden von Häufigkeitsverteilungen.[7]

Viele der statistischen Parameter, die die Eigenschaften so einer Häufigkeitsverteilung abbilden bzw. zusammenfassen sollen, nehmen dabei in Kauf, Informationen zu reduzieren. Das ist gleichzeitig Vorteil wie Nachteil. Wenn das Datenmaterial nicht zu umfangreich ist, kann man auch eine Strichliste führen.

Preussische Volkszählung

Die Bezeichnung „Urliste“ taucht früh im Zusammenhang mit Volkszählungen auf. Dabei wird sie nicht als Schritt in der mathematischen Aufarbeitung statistischer Daten angesprochen. Möchte man folgende Urliste dennoch im Sinne des statischen Begriffs der Urliste einordnen, könnte man sie als Urliste mit hauptsächlich nominal skalierten Merkmalen beschreiben. Lediglich die Zahl an Bewohnern eines Hauses ist absolutskaliert.

Spalten der Urliste für die preussische Volkszählung am 3. Dez. 1864[8]
Durchlaufende Nr.Nummer des HausesVor- und FamiliennameStand oder GewerbeGeburtsjahrReligionZahl der HausbewohnerDatum der AufnahmeBemerkungen

Weblinks

Einzelnachweise

  1. a b c d Günther Bourier: Beschreibende Statistik. Praxisorientierte Einführung mit Aufgaben und Lösungen. 9. Auflage. Gabler Verlag, Wiesbaden 2011, ISBN 978-3-8349-2763-7, S. 34–35 (eingeschränkte Vorschau in der Google-Buchsuche).
  2. a b Hans-Joachim Mittag: Statistik: Eine Interaktive Einführung. 6. Auflage. Springer-Verlag, Berlin 2011, ISBN 978-3-642-17817-7, S. 12 (eingeschränkte Vorschau in der Google-Buchsuche).
  3. Uwe W. Gehring, Cornelia Weins: Grundkurs Statistik für Politologen. 5. Auflage. VS Verlag für Sozialwissenschaften, Wiesbaden 2009, ISBN 978-3-531-53193-9, S. 120 (eingeschränkte Vorschau in der Google-Buchsuche).
  4. a b Siegfried Schumann: Repräsentative Umfrage. Praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren. 4. Auflage. Oldenbourg Wissenschaftsverlag, München 2006, ISBN 3-486-58070-1, S. 137–138 (eingeschränkte Vorschau in der Google-Buchsuche).
  5. Jörg-D. Meißner: Statistik verstehen und sinnvoll nutzen. Anwendungsorientierte Einführung für Wirtschaftler. Oldenbourg Wissenschaftsverlag, München 2004, ISBN 3-486-20035-6, S. 38 (eingeschränkte Vorschau in der Google-Buchsuche).
  6. Georg Bol: Deskriptive Statistik:Lehr- und Arbeitsbuch. 6. Auflage. Oldenbourg Wissenschaftsverlag, München 2004, ISBN 3-486-57612-7, S. 27 (eingeschränkte Vorschau in der Google-Buchsuche).
  7. Benjamin R. Auer, Horst Rottmann: Statistik und Ökonometrie für Wirtschaftswissenschaftler: Eine anwendungsorientierte Einführung. 2. überarb. u. akt. Auflage. Gabler Verlag, 2012 (6. September 2011), ISBN 3-8349-2971-9, S. 13.
  8. eingeschränkte Vorschau in der Google-Buchsuche