Schon seit längerer Zeit hat das benfordsche Gesetz mein Interesse geweckt. Dabei geht es um eine erstaunliche und unerwartete Eigenschaft von zufälligen und nicht-manipulierten Zahlenmengen.

Es bot sich eine spontane Chance, auf einfache Weise eine geeignete Zahlenreihe einmal probeweise zu erzeugen, um sie dann mit einem neuen Objekt der Mathothek zu untersuchen und darzustellen. Von 32 verschiedenen und mehr oder weniger zufälligen Besuchern der Mathothek notierte ich jeweils ihre Hausnummer: 14, 32, 56, 3, 13, 21, 92, 1, 6, 49, 31, 5, 33, 31, 1, 7, 18, 22, 14, 12, 66, 21, 10, 13, 8, 23, 1, 29, 53, 18, 25, 7 (05.02.2025).
Die neun Reagenzgläser entsprechen den neun möglichen Start- oder Anfangsziffern der Zahlen einer gegebenen Zahlenreihe. Startziffer nennen wir die erste Ziffer einer Zahl, die nicht null ist. Beispielsweise ist 5 die Startziffer der Zahlen 5; 520,6; 0,0051. Die Anzahl der Holzkugeln in dem entsprechenden Glasröhrchen gibt an, wie oft diese Ziffer als Startziffer in der Menge der erfassten Hausnummern auftritt. So tritt die Ziffer 1 elfmal als Startziffer auf und beherrscht das Feld. Insgesamt scheint der Zufall die kleineren unter den Startziffern zu bevorzugen. So bilden die Kugeln in den Glasröhrchen eine überraschende Verteilung: Die Anzahl der Kugeln nimmt im wesentlichen von links nach rechts immer mehr ab, die Tendenz dieser Abnahme scheint aber eher kleiner zu werden.

Betrachten und vergleichen wir nun einmal eine ähnlich kleine Zahlenmenge ganz anderer Art, nämlich die ersten 28 Zahlen der nicht nur mathematisch interessanten Fibonacci-Folge: 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121593, 196418, 318011. Diese Zahlenreihe befindet sich auf länglichen Holzperlen, die zu einer Kette aufgereiht und in der Mathothek leicht zugänglich sind. Füllt man Kugeln entsprechend der Anzahlen der jeweiligen Startziffern dieser Zahlenfolge in die Reagenzgläser, so wird die folgende Verteilung sichtbar:

Wir erkennen mit dem ersten Blick bereits die große Ähnlichkeit mit der Verteilung der Startziffern der Hausnummern. Auch hier ist die Eins der überragende Platzhirsch unter den Startziffern. Von links nach rechts nehmen die Kugelzahlen in den Gläschen ab oder bleiben höchstens gleich. In diesem Fall ist der Verlauf der Verteilung der Startzahlen als fallende und links gekrümmte Kurve noch klarer zu erkennen. Alles nur Zufall?
Ein kurzer Hinweis auf ein weiteres Objekt der Mathothek soll hier den Aufbau der Folge der Fibonacci-Zahlen zeigen:

Jede Zahl der Folge ist die Summe ihrer beiden Vorgängerzahlen. Die beiden ersten Zahlen sind 1.
Verlassen wir jetzt einmal diese Beschäftigung mit solch kleinen Zahlenmengen und werfen einen Blick auf „das Große und Ganze“, d.h. wir betrachten einmal die Flächengrößen der 191 Mitgliedsstaaten der UNO, des Vatikans und Taiwans aus dem Jahre 2008 (aus „Best of National Geographic“). Die Verteilung der Startziffern ergibt sich folgendermaßen: 51 mal die 1; 40 mal 2; 23 mal 3; 22 mal 4; 14 mal 5; 11 mal 6; 15 mal 7; 6 mal 8 und 11 mal die 9.
Für eine anschauliche Darstellung dieser Analyse benutzen wir auch hier unsere „Röhrchen“. Dazu ordnen wir 4,25 Treffern eine Kugel zu und nehmen notwendige Rundungen vor. Dann erhalten wir folgendes anschauliche Bild der Verteilung der Startziffern in dieser Zahlenmenge von 193 Angaben zu Flächengrößen:

Auch hier erkennen wir die große Ähnlichkeit im Verteilungsmuster der Startziffern, wie wir es schon in den voran gegangenen Beispielen beobachten konnten. Und das bei Zahlenmengen im Zusammenhang mit völlig verschiedenen Sachverhalten.
Auch die Preise der angebotenen Artikel von Supermärkten bestätigen, dass unsere bisherige Beobachtung keine reinen Hirngespinste oder extreme Zufälle sind. Ein weiteres Beispiel für unser Phänomen ist eine Einkaufsliste nach einem Angebot eines Supermarktes (Galeria Kaufhof), aus dem eine Schülerin eine Liste von 41 Artikeln zusammenstellte: Das Ergebnis ist hier als Kugelverteilung zu sehen:

Trotz der auch hier recht gut zu erkennenden Annäherung an die bereits mehrfach beobachtete Form der Verteilung der Kugeln, weist der Ausreißer bei der Anzahl der Fälle, in denen die 9 als Startziffer auftritt, auf eine Manipulation hin. Diese Abweichung lässt sich bei solchen Angebotspreislisten ziemlich häufig beobachten und durch die große Zahl von „kundenfreundlichen Abrundungen“ der Preise auf „0,9. Euro“ erklären.
Wir machen hier überraschend erstaunliche Beobachtungen hinsichtlich der Verteilung der Startziffern bei Datenmengen aus ganz und gar verschiedenen Bereichen. Dahinter steckt ein Gesetz, das nach seinem Wiederentdecker, dem Physiker Frank Benford, benannt wurde.
Benfordsches Gesetz:
Reale, empirische Datensätze, die genügend umfangreich sind und Werte mit verschiedenen Größenordnungen umfassen, aber keinesfalls manipuliert wurden, sind näherungsweise Benford-verteilt. In diesem Fall beträgt die Wahrscheinlichkeit p(k) dafür, dass die Zahl k=1; 2; 3; 4; 5; 6; 7; 8 oder 9 als Startziffer in diesem Datensatz auftritt:

Rundet man die Werte auf eine Nachkommastelle, so erhält man folgende Wahrscheinlichkeiten:
p(1)=30,1 % p(2)=17,6% p(3)=12,5% p(4)=9,7% p(5)=7,9%
p(6)=6,7% p(7)=5,8% p(8)=5,1% P(9)=4,6%
Leider gibt es kein einfaches und strenges Kriterium, um zu erkennen, ob ein gegebener Datensatz benford-verteilt ist.
Mit unseren „Reagenzgläsern“ können wir uns auch hier eine gute und anschauliche Vorstellung von der „idealen“ Verteilung der Wahrscheinlichkeiten machen, mit der die Ziffern von 1 bis 9 als Startziffern auftreten. (Eine Kugel steht hier für 2,5% Wahrscheinlichkeit):

Die benfordsche Formel ist im ersten Moment doch sehr überraschend, weil wir bei der ersten Begegnung mit diesen Wahrscheinlichkeiten mit einem nicht reflektierten Vorurteil in Konflikt geraden. Wir haben naiver Weise angenommen, dass die neun möglichen Startziffern selbstverständlich gleich wahrscheinlich (und zwar zu je 1/9) sind und damit gleich verteilt sein müssten.
Diese unserer Intuition widerstrebende Gesetzmäßigkeit hat der amerikanische Physiker Frank Benford (1883–1948) wiederentdeckt, anhand von über 20.000 Daten studiert und systematisch analysiert, mathematisch formuliert sowie bekanntgemacht.
Mit einem weiteren Experiment der Mathothek lässt sich etwas mehr Licht in den oben beschriebenen Widerspruch bringen:

Es befinden sich in diesem schönen Kästchen 66 kleine Würfel mit den Ziffern von 1 bis 9 und zwei Vorlagen mit Spalten, die einmal gleich breit sind und das andere Mal von links nach rechts schmäler werden. Die Würfel mit den Ziffern entsprechen recht gut dem benfordschen Gesetz.

Legt man nun die Würfelchen entsprechend ihren Startziffern, so wie wir es vorher mit den Kugeln und den Röhrchen gemacht haben, dann erhalten wir im ersten Fall die folgende nicht mehr überraschende Verteilung:


Im zweiten Fall platzieren wir die Würfelchen „schön ordentlich“ in die zweite Vorlage:


Und schon haben wir im ersten Moment ein gutes Gefühl. Das entspricht doch eher unserer Erwartung – einer Gleichverteilung – schon wesentlich besser. Der Unterschied zwischen den beiden Darstellungen besteht darin, dass wir im ersten Fall eine additive und im zweiten Fall eine multiplikative (oder logarithmische) Skalierung für die Belegfläche haben. Im ersten, dem additiven Fall, addieren wir neunmal dieselbe Breite. Im zweiten Fall – dem multiplikativen oder logarithmischen – ergeben sich die Abstände zwischen den Trennlinien von links nach rechts folgendermaßen. Statt log10(x)=y benutzen wir ab hier die für den Zehner-Logarithmus übliche Schreibweise lg(x)=y.
lg(2)-lg(1)=0,301… , lg(3)-lg(2)=0,176… , lg(4)-lg(3)=0,124… , lg(5)-lg(4)=0,096… , lg(6)-lg(5)=0,079… ,
lg(7)-lg(6)=0,066… , lg(8)-lg(7)=0,057… , lg(9)-lg(8)=0,057… , lg(10)-lg(9)=0.045… Einheiten.
Das sind doch genau die nicht gerundeten Werte der bendorfschen Verteilung!
Die multiplikative oder logarithmische Skalierung können wir gut in den drei senkrechten Spalten auf dem dem Objekt beigefügten Logarithmenpapier erkennen:

lg1________lg2___lg3__lg4_lg5………….lg10
Aber auch auf der entsprechenden Skala der logarithmischen Rechenstäbe erkennen wir die entsprechende Skalierung in den kleiner werdenden Abständen der Zahlen 1, 2, 3, 4, 5, 6, 7, 8, 9 und 10 auf der x-Achse.

Leider besitzt die Mathothek keine wirklich „alte“ Logarithmen-Tafel, die genügend Nutzungsspuren aufweisen könnte. Mithilfe einer solchen entdeckte nämlich der Astronom und Mathematiker Simon Newcomb 1881 sein Mantissengesetz. Er hatte bemerkt, dass in den benutzten Logarithmen-Büchern die Seiten mit Tabellen, die mit 1 als erster Ziffer starteten, deutlich mehr Eselsohren aufwiesen und schmutziger waren als die anderen: Offenbar waren sie öfter benutzt worden. Die Abhandlung Newcombs blieb aber so gut wie unbeachtet. Erst der Physiker Frank Benford entdeckte 1938 die Verteilung der Wahrscheinlichkeiten der Startziffern wieder. Nachdem Benford die Vermutung über die Bevorzugung der kleineren Zahlen als Startziffern gründlich überprüft und bekanntgemacht hatte, wurde die Verteilung der Startziffern in nicht manipulierten Datensätzen nach ihm „benfordsches Gesetz“ benannt. In neuerer Zeit wird aber auch durch die Bezeichnung „Newcomb-Benford’s Law“ (NBL) die Leistung seines „Vorarbeiters“ gewürdigt, war doch dessen Mantissengesetz Grundlage für Benfords Arbeiten. Wirklich bekannt und bedeutend für die Anwendung wurde das NBL aber erst durch den US-Amerikaner Theodore Hill, als dieser dessen Nützlichkeit und Anwendungsmöglichkeiten untersuchte und veröffentlichte. So lassen sich mithilfe des NBL beispielsweise Fälschungen von Bilanzen und anderen Datensätzen entdecken und damit auch aufdecken.

Mithilfe der verschiedenen Perlen sind nun verschiedene Darstellungen von Datensätzen möglich, die aber aufgrund der Skalierungsinvarianz im wesentlichen gleich sind. Einer neueren Darstellung der Flächengrößen von 251 Ländern der Erde ergeben sich folgende Verteilungen:
Eine kleine grüne Perle entspricht jeweils einer Startziffer (71-47-31-26-22-16-18-7-13):

Eine rote Perle entspricht gerundet 2 Startziffern:

Eine große grüne Perle entspricht (gerundet) 4 Startziffern:

Dass dies grundsätzlich in Ordnung geht, dafür sorgen zwei Invarianz-Eigenschaften des benfordschen Gesetzes, die diese Verteilung einzigartig machen:
Skaleninvarianz: Wenn bei einem Datensatz die Startziffern benford-verteilt sind und man alle Zahlen des Datensatzes mit einer bestimmten Konstanten multipliziert, dann ist auch der neue Datensatz benford-verteilt. Die Multiplikation eines Datensatzes mit einer bestimmten Konstanten entspricht der Addition einer bestimmten Konstanten auf der Seite der Logarithmen.
Basisinvarianz: Wenn ein Datensatz, der im Zehnersystem gegeben ist und dort das benfordsche Gesetz erfüllt, dann erfüllt er es auch nach einer Umrechnung in ein anderes Zahlensystem, z.B. ins 12er-System oder hexadezimale.
Beide Beispiele zeigen uns, dass die mithilfe verschiedener Kugelgrößen dargestellten Verteilungen im wesentlichen ähnlich sind. Wenn es bei den oberen Beispielen im Einzelfall einmal anders erscheint, so liegt der Grund im Ab- oder Aufrunden der Jeweiligen Anzahlen der Startzahlen in die entsprechenden Anzahlen von Perlen.
Das benfordsche Gesetz trifft besonders gut für Datensätze zu, wenn diese aus natürlichen Wachstumsprozessen stammen. Dann verändern sich die Zahlen nämlich im Laufe der Zeit und vervielfachen sich. Das entspricht der logarithmischen Verteilung, die das benfordsche Gesetz aussagt, und ist unabhängig von der Zeit, in der eine Vervielfachung erfolgt. Dann beginnt der Zyklus von Neuem bei der 1. Hier erklärt sich auch der Zusammenhang des benfordschen Gesetzes mit der mathematisch so bedeutenden Fibonacci-Folge und anderen fraktalen mathematischen Folgen und Wachstumserscheinungen. Untersucht man die ersten 1476 Zahlen der Fibonacci-Folge auf die Anzahlen der Auftritte der Zahlen 1 bis 9 als Startziffern, so stimmen die Ergebnisse in Prozenten bis auf die erste Nachkommastelle mit der erwarteten benfordschen Verteilung – bis auf eine Ausnahme – überein:
(Startziffer / Häufigkeit / Prozentsatz):
( 1 / 445 / 30,14% ); ( 2 / 260 / 17,61% ); ( 3 / 184 / 12,46% );
( 4 / 143 / 9,68% ); ( 5 / 117 / 7,92% ); ( 6 / 98 / 6,63%);
( 7 / 85 / 5,75% ); ( 8 / 77 / 5,21% ); ( 6 / 67 / 4,53% )
In der Mathothek gibt es ein breites Angebot zum Thema Fibonacci-Zahlen und auch zu Fraktalen, s.u.
Die Beschäftigung mit den in der Zeit vor Taschenrechner und Computer praktisch unverzichtbaren Rechenhilfen – Logarithmen-Tafel und Rechenschieber – kann auch zum interessanten Zugang und besseren Verständnis der Potenz- und Logarithmen-Gesetze führen.


Inzwischen gibt es zwar immer noch keine „antike“ Logarithmentafel in der Mathothek, aber immerhin eine, die noch bis zur Einführung des Taschenrechners benutzt wurde (Klett-Verlag) und eine noch ältere:



Vielleicht zeigt die ältere der beiden Tafeln doch stärkere Nutzungsspuren bei den Zahlen, die mit der Startziffer 1 beginnen???
In der Mathothek gibt es zahlreiche Exponate zur Fibonacci-Folge und ihren Auftritten in den unterschiedlichsten Bereichen. Hier ein paar Beispiele:
Vermehrung eines Kaninchenpaares:

Anzahl der „Spiralen“ bei verschiedenen Zapfen und beim Pflanzenwachstum:





„Stammbaum der Drohne Willi“:

Fibonacci-Folge in der Kunst:


Nautilus und Goldene Spirale:


Ebenso gibt es sehr viele Objekte in der Mathothek zu den Themen deterministisches Chaos und Selbstähnlichkeit. Hier nur zwei Beispiele:







