In einem System befinden sich N unterscheidbare Teilchen. Diese
können sich mit der Wahrscheinlichkeit p ()
in einem Zustand 1 sowie mit der Wahrscheinlichkeit
in einem Zustand 2 befinden. Diese Zustände könnten z.B. der Grundzustand
und ein energetisch angeregter Zustand in einem Atom sein. Oder aber
wir betrachten ein Gefäß, das aus zwei Kammern besteht, die über eine
Öffnung miteinander verbunden sind. Bei einem Gas (bestehend aus N
identischen Teilchen) in diesem Gefäß könnten wir dann die Frage stellen,
wie groß die Wahrscheinlichkeit ist, eine bestimmte Anzahl von Teilchen
in der einen (1. Zustand) oder der anderen Kammer (2. Zustand) vorzufinden.
Die Wahrscheinlichkeit, gerade n Teilchen im 1. Zustand (und somit
im zweiten) vorzufinden, ist nach Binomi:
mit
.
Der sog. Binomialkoeffizient
gibt Auskunft über die Anzahl der Möglichkeiten, unterscheidbare Teilchen
auf die zwei Zustände zu verteilen. Es gibt nämlich
Möglichkeiten, den 1. Zustand mit n aus den N Teilchen zu
besetzen (bzw. den 2. Zustand mit aus den N
Teilchen zu bevölkern). Die Anzahl der möglichen Vertauschungen der
n Teilchen im 1. Zustand untereinander, d.h. ,
soll aber nicht mitgezählt werden, weshalb noch durch
dividiert werden muss.
Wir können uns zudem fragen, wie viele Teilchen im Mittel im 1. Zustand
zu erwarten sind. Einen solchen Erwartungs- oder Mittelwert der Teilchenzahl
n im 1. Zustand definieren wir dabei wie folgt:
.
An dieser Stelle bemerken wir, dass wir
schreiben können, wenn wir q bei der partiellen Differenziation
festhalten:
.
.
Außerdem können wir uns noch die Frage stellen, wie groß die Schwankungen
(bzw. das Schwankungsquadrat) um diesen Mittelwert sind:
und benötigen hierzu also noch die Größe :
.
Hiermit erhalten wir für das Schwankungsquadrat:
.
Über diese Mittelwert-Bildungen haben wir uns einen guten Überblick
verschafft, wie sich das betrachtete N-Teilchensystem im Mittel
verhält. Die Wahrscheinlichkeit p dafür, dass sich ein Teilchen
im 1. Zustand befindet, muss dabei »von außen« vorgegeben werden.
Doch wie können wir im physikalischen Alltag zu verlässlichen Werten
hierfür gelangen? Ein naheliegender Ansatz wäre, die Wahrscheinlichkeit
p durch eine relative Häufigkeit zu ersetzen, z.B. indem wir messen,
wie viele Teilchen sich im Mittel im 1. Zustand befinden, und wählen
dann für p:
.
Um einen verlässlichen Schätzwert für den Mittelwert
zu erhalten, sollten wir aber möglichst Systeme mit großen Teilchenzahlen,
d.h. mit , betrachten, damit die relativen Schwankungen
um möglichst gering werden:
.
Außerdem haben wir noch das Problem, dass die Binominal-Verteilung mit
ihren Summenbildungen recht unhandlich ist. Wenn wir uns im Wesentlichen
nur dafür interessieren, wie sich die Verteilung in der Nähe des Mittelwertes
der Besetzungszahlen des 1. Zustands verhält, betrachten wir sie also
vorzugsweise für Werte von n in der Umgebung von :
.
Hierzu drücken wir die Binominal-Verteilung statt in n in einer
neuen Variablen aus und verwenden die
Stirling-Formel ,
die ja für große Teilchenzahlen eine gute Näherung für Fakultäten
zu sein verspricht:
.
An dieser Stelle sind wir eigentlich schon einen Schritt zu weit gegangen:
Der Term
ist wegen näherungsweise das
Schwankungsquadrat, das wir gleichermaßen als bekannt voraussetzen
möchten, d.h. neben dem Mittelwert wird im Folgenden
auch noch dessen Schwankungsquadrat als
vorgegeben betrachtet. Unter diesen Voraussetzungen ergibt sich folgende
Näherung für die Poisson-Verteilung:
.
Da ja nach Voraussetzung gelten soll, werden
wir
um diesen Punkt herum per Taylor entwickeln:
.
Mittels und den Ableitungen
,
an der Stelle , d.h.
,
,
,
erhalten wir für jene Entwicklung um diese offensichtliche Maximumstelle
(denn die erste Ableitung von
verschwindet an dieser Stelle und die zweite Ableitung ist negativ):
bzw.
.
Dies ist die berühmte Gauss'sche Glockenkurve um einen Mittelwert
mit einem Schwankungsquadrat .
Dass diese Gauss'sche Wahrscheinlichkeitsverteilung wieder auf Eins
normiert ist, erkennt man durch Integration der Kurve über alle (kontinuierliche
vielen) Werte n links und rechts des Mittelwertes :
,
wobei die Substitution
angewandt wurde.
Die Gauss'sche Glockenkurve ist nicht die einzig mögliche Approximation
der Binomialverteilung. Wenn man erneut vom Mittelwert ausgeht und
diesmal verlangt, dass dieser konstant bleiben soll statt eine Funktion
von p zu sein, d.h. , dann folgt
daraus für große Teilchenzahlen, d.h. .
Wenn wir jetzt in der Binomialverteilung
einsetzen, Faktoren abspalten, die im Limes
entweder Eins werden oder über die Euler-Formel
auf die Euler'sche Zahl e führen, dann erhalten wir
,
weil die einzelnen Faktoren in der eckigen Klammer im Limes N
gegen Unendlich jeweils gegen Eins gehen. Gleiches gilt für den Faktor
,
da ja n eine endliche Größe ist (d.h. nicht gegen Unendlich
geht), während sich hinter der Folge
eine Exponentialfunktion verbirgt (s. mathematische Ergänzunge).
Die Poisson-Verteilung
ist dabei tatsächlich wieder auf Eins normiert:
,
wobei wir hier die Taylor-Reihe für die Exponentialfunktion verwendet
haben. Nach den getroffenen Voraussetzungen muss zudem der Mittelwert
von n wieder gleich sein, was wir hier überprüfen
werden:
.
Eine erstaunliche Eigenschaft der Poisson-Verteilung ist, dass wegen
auch das Schwankungsquadrat
gleich dem Mittelwert ist.
Wenn beim Zweizustandssystem die Wahrscheinlichkeiten für ein Teilchen,
sich im ersten oder im 2. Zustand zu befinden, gleich ist, d.h.
gilt, dann ergibt sich aus der Poisson-Verteilung unmittelbar
,
die somit etwas darüber aussagt, mit welcher Wahrscheinlichkeit sich
genau n aus den N Teilchen im ersten Zustand befinden. Dabei
können die N Teilchen insgesamt mögliche
Zustände einnehmen (nämlich jedes Teilchen zwei). Anders ausgedrückt,
erwartet man also, dass es von den insgesamt Möglichkeiten gibt,
um genau n (unterscheidbare) Teilchen im ersten Zustand vorzufinden.
Wir können uns nun die Frage stellen, bei welchem n die Anzahl
der Möglichkeiten, Teilchen im ersten Zustand vorzufinden, maximal
wird. Hierzu ist es mathematisch am einfachsten,
zu bilden, um dann die Stirling-Formel anzuwenden und anschließend
das Maximum jener Funktion zu suchen. D.h. wir erhalten zunächst
,
wobei wir die Größen
und eingeführt haben,
die etwas darüber aussagen, mit welchem Bruchteil der Teilchen N
der erste bzw. zweite Zustand besetzt sind. Ihre Summe ergibt offensichtlich
wieder Eins: .
Da bei der Suche des Maximums von
die Teilchenzahl konstant gehalten wird, können wir uns dabei genauso
gut auch auf die Funktion
beschränken. Mit Hilfe der der Methode der Lagrange-Multiplikatoren
wird die Nebenbedingung
berücksichtigt:
,
wobei der eingeführte Lagrange-Multiplikator
ist. Von dieser Funktion
ist also das Maximum gesucht.
Besitzt das betrachtete System nicht nur zwei sondern z Zustände,
die mit Teilchen besetzt sein sollen,
wobei wieder
gelten muss, dann wären wir von einem sog. Multinomialkoeffizienten,
und einer Multi- oder Polynomialverteilung ausgegangen:
mit und .
In der Mathematik wird (z.B. per vollständige Induktion) gezeigt,
dass erneut
gilt, wobei die erste Summe bedeuten soll, dass über alle möglichen
Kombinationen der Besetzungszahlen
summiert wird, bei der die Summe über diese Besetzungszahlen wiederum
gleich der gesamten Teilchenzahl N ist.
Wenn die Besetzung der z Zustände wieder gleich wahrscheinlich
wäre, resultierte für die Wahrscheinlichkeiten jeweils .
Weil es insgesamt Möglichkeiten gibt, die Zustände
mit N Teilchen zu bevölkern, und
ist, gälte dann entsprechend auch .
Wir hätten schließlich die
Größen als »relative Besetzungszahlen« definiert und wären zu
mit
gelangt. Die relativen Besetzungszahlen der Zustände
erinnern in ihrer Definition und ihren Eigenschaften also sehr an
»relative Häufigkeiten« oder sogar Wahrscheinlichkeiten.
Gesucht sei jetzt also die wahrscheinlichste Besetzung der Zustände
. Da die Gesamtzahl der Teilchen eine Konstante
ist, genügt es wieder, das Maximum einer Funktion
unter der Nebenbedingung
zu suchen. Um die Nebenbedingung zu berücksichtigen, können wir ja
wieder auf die Methode der Langrange-Multiplikatoren zurückgreifen,
indem wir einen Langrange-Multiplikator einführen.
D.h. wir suchen das Maximum der Funktion
Für erhalten wir natürlich wieder unser Ausgangsbeispiel
für nur zwei Zustände.
Wir werden im Folgenden die Funktion
nach den variieren und
diese Variation gleich Null setzen, um nach den Extremwerten der Funktion
Ausschau zu halten. Die Variationen der
können wir dabei sogar als voneinander unabhängig betrachten, da wir
ja ihre Abhängigkeiten untereinander (über )
durch das Einführen des Lagrange-Multiplikators als weiteren Parameter
bereits berücksichtigt haben. D.h. wir können aus
folgern, dass ihre Koeffizienten
einzeln verschwinden, d.h.
gilt. Mit anderen Worten: Die Variationen
der relativen Besetzungzahlen
sind linear unabhängig. Dies erleichtert die Durchführung der Extremwertsuche
ungemein:
.
D.h. wir können folgern, dass die Koeffizienten der
einzeln verschwinden müssen:
,
woraus resultiert. Den
Parameter können wir aus der Nebenbedingung
bestimmen:
,
was und somit
ergibt. Die relativen Besetzungszahlen
fallen also mit den Besetzungswahrscheinlichkeiten
hinsichtlich ihres Wertes zusammen. Im Limes großer Teilchenzahlen
(den wir ja annehmen mussten, um die Stirling-Formel anwenden zu dürfen)
und bei der angesetzten gleichen Besetzungswahrscheinlichkeit aller
z Zustände sind somit die relativen Besetzungszahlen in Besetzungswahrscheinlichkeiten
übergegangen. Dies gilt zumindest, wenn wie hier das Maximum der Anzahl
aller Besetzungsmöglichkeiten gesucht wurde. Dass es sich bei der
gefundenen Lösung um ein Maximum (und nicht etwa um ein Minimum) handelt,
geht z.B. aus der Gaußverteilung hervor, die ja (wie bereits zuvor
festgestellt) unter gewissen Voraussetzungen in diesem Limes eine
Näherung der Binomial-Verteilung darstellt und als »Glockenkurve«
ein ausgeprägtes Maximum (aber kein Minimum) besitzt.
In der statistischen Mechanik wird gerne die gleiche Wahrscheinlichkeit
aller Zustände eines Systems angenommen. Gleichermaßen wird die sog.
»Entropie« S postuliert, die sich von der oben bereits eingeführten
Größe
nur noch durch einen Faktor unterscheidet, der
die sog. »Boltzmannkonstante« darstellen soll:
,
wobei
gelte.