Phrasenlänge

Phrasenlänge wird definiert durch die Zahl sprachlicher Einheiten, aus denen eine Phrase besteht. Phrase selbst ist kein ganz eindeutiger Begriff, da er in verschiedenen wissenschaftlichen Kontexten (traditionelle Grammatik, generative Grammatik, …) unterschiedlich verstanden wird. In vielen Fällen entspricht Phrase dem Satzglied.

Bestimmung der Phrasenlänge

Die Phrasenlänge kann durch die Zahl jeder kleineren Einheit (Buchstaben, Laute, Morphe, Silben und andere) bestimmt werden. Bisher wurde die Phrasenlänge durch die Zahl der Buchstaben oder Phoneme oder auch durch die der Wörter angegeben.[1]

Bedeutung der Phrasenlänge

Die Phrasenlänge wurde bisher sowohl in der Quantitativen Stilistik als auch in der Quantitativen Linguistik verwendet.

Bedeutung der Phrasenlänge in der Stilistik

In der Quantitativen Stilistik können mit Hilfe des Kriteriums der Phrasenlänge Textsorten unterschieden werden; Hoffmann[2] gibt am Beispiel des Russischen folgende Übersicht zur Phrasenlänge von Subjektgruppen (= Wortgruppe, die das Subjekt im Satz ausmacht) in zwei unterschiedlichen Textgruppen:

PhrasenlängeWissenschaftliche ProsaKünstlerische Prosa
011.43.8
127.373.7
224.113.9
312.44.3
48.41.7
≥516.42.6

Die Phrasenlänge ist hier durch die Zahl der Wörter je Phrase angegeben. Es ist eine deutliche Tendenz zu größeren Phrasenlängen der Subjektgruppen in der wissenschaftlichen Prosa erkennbar; das Gleiche gilt auch für die Prädikatgruppe.[3]

Bedeutung der Phrasenlänge in der Linguistik

In der Quantitativen Linguistik wurden Texte daraufhin untersucht, welche Phrasenlängen wie häufig in ihnen vertreten sind. Ziel dieser Untersuchungen war es, die Verteilung der Phrasenlängen als einem Sprachgesetz folgend zu erweisen. Für die Phrasenlängenverteilung in Fachzeitschriften der Betriebswirtschaftslehre konnte gezeigt werden, dass sie der 1-verschobenen Hyperpoisson-Verteilung folgen[4]:

xn(x)NP(x)
1383382.70
2701700.45
3427412.56
4121144.79
52836.19
6197.02
761.28

In der Tabelle ist x: Zahl der Autosemantika (Wörter mit selbständiger lexikalischer Bedeutung) pro Phrase, n(x) die in dem ausgewerteten Korpus beobachtete Zahl der Phrasen der Länge x; NP(x) die Zahl der Phrasen der Länge x, die berechnet wird, wenn man die 1-verschobene Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Der Test ergibt mit dem Diskrepanzkoeffizienten C = 0.0036, dass die 1-verschobene Hyperpoisson-Verteilung ein gutes Modell für die beobachteten Daten ist. Das Ergebnis eines solchen Tests wird als gut bewertet, wenn C ≤ 0.01 ist, was in diesem Fall zutrifft. Die Untersuchung eines kurzen Textes aus Lichtenbergs Sudelbüchern erbrachte ein ebenso gutes Ergebnis.[5] Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.

An die Daten der Nominalphrasen in einem sehr umfangreichen Textkorpus des britischen Englischen (über 100000 NPs) hat Wang Hua in einer neuen Untersuchung ein anderes Modell erfolgreich angewendet.[6]

Siehe auch

Einzelnachweise

  1. Lothar Hoffmann: Kommunikationsmittel Fachsprache. Eine Einführung. Zweite völlig neu bearbeitete Auflage. Narr, Tübingen 1985, S. 194. ISBN 3-87808-771-3.
  2. Hoffmann 1985, S. 194.
  3. Hoffmann 1985, S. 195.
  4. Karl-Heinz Best: Verteilung von Phrasen- und Subsatzlängen in deutscher Fachsprache. In: Naukovyj Visnyk Černivec'koho Universytetu: Herman'ska filolohija. Vypusk 319-320, 2006, S. 113–120, Beispiel S. 116. Die Daten für den hier präsentierten und etliche weitere Tests sind der Untersuchung von Schefe entnommen: Peter Schefe: Statistische syntaktische Analyse von Fachsprachen mit Hilfe elektronischer Rechenanlagen am Beispiel der medizinischen, betriebswirtschaftlichen und literaturwissenschaftlichen Fachsprache im Deutschen. Kümmerle, Göppingen 1975. ISBN 3-87452-293-8. (Erweiterte und überarbeitete Fassung der Dissertation.)
  5. Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, S. 51. ISBN 3-933043-17-4.
  6. Wang Hua: Length and complexity of NPs in Written English. In: Glottometrics 24, 2012, Seite 79–88 (PDF Volltext); Verteilung der Längen der NPs: Seite 82f.