Zipf-Verteilung-Buchstaben


Autor/Urheber:
Größe:
721 x 475 Pixel (6187 Bytes)
Beschreibung:
Vergleich der Verteilung von Buchstabenhäufigkeiten eines Textes mit einer Verteilung nach Zipf

Häufigkeit der Buchstaben und einiger Satzzeichen in einem deutschen Text

Rang Wort  rel. Häuf.  zipfsche Häufigkeit
  1     E  0.13678     0.23955
  2 Leerz. 0.13048     0.11977
  3     N  0.09034     0.07985
  4     I  0.06908     0.05989
  5     R  0.06501     0.04791
  6     S  0.05426     0.03992
  7     T  0.05386     0.03422
  8     D  0.04119     0.02994
  9     A  0.04011     0.02662
 10     U  0.03947     0.02395
 11     H  0.03565     0.02178
 12     L  0.03449     0.01996
 13     G  0.02820     0.01843
 14     C  0.02565     0.01711
 15     O  0.02016     0.01597
 16     M  0.01938     0.01497
 17     B  0.01743     0.01409
 18     F  0.01663     0.01331
 19     W  0.01409     0.01261
 20     K  0.01230     0.01198
 21     Z  0.01032     0.01141
 22     .  0.00818     0.01089
 23     ,  0.00790     0.01042
 24     V  0.00755     0.00998
 25     Ü  0.00613     0.00958
 26     P  0.00560     0.00921
 27     Ä  0.00537     0.00887
 28     Ö  0.00289     0.00856
 29     J  0.00064     0.00826
 30     Q  0.00033     0.00798
 31     Y  0.00027     0.00773
32 X 0.00014 0.00749
Lizenz:
Credit:
Eigenes Werk (Originaltext: selbst erstellt)
Bild teilen:
Facebook   Twitter   Pinterest   WhatsApp   Telegram   E-Mail
Weitere Informationen zur Lizenz des Bildes finden Sie hier. Letzte Aktualisierung: Sat, 02 Mar 2024 04:20:10 GMT

Relevante Bilder


Relevante Artikel

Zipfsches Gesetz

Das Zipfsche Gesetz ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Sprachwissenschaft (Linguistik), speziell in der Korpuslinguistik und Quantitativen Linguistik, wo es zum Beispiel versucht, die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung zu setzen. Das Zipfsche Gesetz markierte den Beginn dieses Ansatzes der Quantitativen Linguistik. Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung bzw. Zipf-Verteilung mathematisch beschrieben wird. .. weiterlesen