Zipf-Verteilung-Buchstaben
Häufigkeit der Buchstaben und einiger Satzzeichen in einem deutschen Text
Rang Wort rel. Häuf. zipfsche Häufigkeit 1 E 0.13678 0.23955 2 Leerz. 0.13048 0.11977 3 N 0.09034 0.07985 4 I 0.06908 0.05989 5 R 0.06501 0.04791 6 S 0.05426 0.03992 7 T 0.05386 0.03422 8 D 0.04119 0.02994 9 A 0.04011 0.02662 10 U 0.03947 0.02395 11 H 0.03565 0.02178 12 L 0.03449 0.01996 13 G 0.02820 0.01843 14 C 0.02565 0.01711 15 O 0.02016 0.01597 16 M 0.01938 0.01497 17 B 0.01743 0.01409 18 F 0.01663 0.01331 19 W 0.01409 0.01261 20 K 0.01230 0.01198 21 Z 0.01032 0.01141 22 . 0.00818 0.01089 23 , 0.00790 0.01042 24 V 0.00755 0.00998 25 Ü 0.00613 0.00958 26 P 0.00560 0.00921 27 Ä 0.00537 0.00887 28 Ö 0.00289 0.00856 29 J 0.00064 0.00826 30 Q 0.00033 0.00798 31 Y 0.00027 0.0077332 X 0.00014 0.00749
Relevante Bilder
Relevante Artikel
Zipfsches GesetzDas Zipfsche Gesetz ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Sprachwissenschaft (Linguistik), speziell in der Korpuslinguistik und Quantitativen Linguistik, wo es zum Beispiel versucht, die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung zu setzen. Das Zipfsche Gesetz markierte den Beginn dieses Ansatzes der Quantitativen Linguistik. Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung bzw. Zipf-Verteilung mathematisch beschrieben wird. .. weiterlesen