galtonbrett/content/Mathematischer_Hintergrund.tex

%"ltex.language": "de-DE"
\subsection{Beweis des zentralen Grenzwertsatzes}
Das Galton-Brett (nach Francis Galton) dient der Veranschaulichung der Binomialverteilung und der experimentellen Bestätigung vom Zentralen Grenzwertsatz im Spezialfall der Binomialverteilung. Im Folgenden formalisieren wir den Weg einer Kugel durch das Brett als stochastischen Prozess als Binomialverteilung und Beweisen anschließend den Zentralen Grenzwertsatz von Moivre-Laplace \cite{nahrstedt_monte-carlo-methode_2015}.
\begin{definition}[Modell des Galton Brett]{galton}{nach \cite[S. 252-253]{buchter_elementare_2005}}
	Sei $(\Omega, \mathcal{F}, P)$ ein Wahrscheinlichkeitsraum. \\
	Der Fall einer Kugel durch ein Galton-Brett mit $n \in \mathbb{N}$ Reihen wird modelliert durch eine Folge von stochastisch unabhängigen und identisch verteilten Zufallsvariablen $X_1, X_2, \dots, X_n$, wobei $X_i \in \{0, 1\}$.
	Dabei beschreibt \textbf{$X_i = 1$ den Fall nach rechts} in der $i$-ten Reihe und \textbf{$X_i = 0$ den Fall nach links}. Die Wahrscheinlichkeit sei $P(X_i = 1) = p$ und $P(X_i = 0) = 1-p = q$. Bei einem symmetrischen Brett gilt $p = q = 0.5$.
\end{definition} %Bild?
\begin{figure}[htbp]
	\centering
	% Erstes Bild
	\begin{minipage}[t]{0.45\textwidth}
		\centering
		\includegraphics[width=\linewidth]{./images/Galtonbrett.png}
		\caption{Darstellung des Galtonbretts nach \cite{arndt_brunner_simulation_2025}}
		\label{fig:galton}
	\end{minipage}
	\hfill
	% Zweites Bild
	\begin{minipage}[t]{0.45\textwidth}
		\centering
		\includegraphics[width=\linewidth]{./images/Galton_Hüpfbild.png}
		\caption{Darstellung der Zufallsvariable $X_i$ im Kontext vom Galtonbrett}
		\label{fig:galtonXi}
	\end{minipage}
\end{figure}
Hierbei ist anzumerken, dass jedes $X_i$ Bernoulliverteilt ist, da
\[
	\Omega = \{1,0\} \quad \text{und} \quad
	P(X_i = x) =
	\begin{cases}
		p & \text{wenn } x=1\\
		1-p & \text{wenn } x=0
	\end{cases}
\]
Somit lässt sich auch $X_i \sim \mathcal{B}_{0,5}$ schreiben.\\
Um jeden Ausgang des Galton-Brettes durchnummeriert von links nach rechts unterscheiden zu können, definieren wir uns eine weitere Zufallsvariable Sn wie folgt:
\begin{definition}[Zufallsvariable $S_n$]{Sn}{nach \cite[min. 0:50]{statistik_verstehen_beweis_2019}}
	Die Endposition der Kugel im Fach $k \in \{0, 1, \dots, n\}$ wird durch die Summe der Rechtsabbiegungen beschrieben. Wir definieren die Zufallsvariable: \[S_n = \sum_{i=1}^n X_i\]
\end{definition}
Um diese Summierte Zufallsvariable genauer zu verstehen betrachten wir zuerst den Binomialkoeffizienten.
% Def
Betrachten wir nun den Binomialkoeffizienten in Bezug auf $S_n$, beschreibt dieser exakt die Anzahl der möglichen Pfade durch das Galton-Brett, bei denen die Kugel von $n$ Reihen genau $k$-mal nach rechts (und somit $(n-k)$-mal nach links) fällt. Da jeder dieser einzelnen Pfade aufgrund der Unabhängigkeit der Entscheidungen die Wahrscheinlichkeit $p^k (1-p)^{n-k}$ besitzt, ergibt sich die Gesamtwahrscheinlichkeit für das Fach $k$ durch Multiplikation. Daher rührt die Binomialverteilung:
\begin{definition}[Binomialmodell]{binModell}{\cite{kosenkova_stochastik_2025}}
	Wiederholt man ein Bernoulli-Experiment mit Erfolgswahrscheinlichkeit $p \in [0,1]$ $n$-mal, und interessiert sich nur für die Anzahl der erfolgreichen Experimente, so wählt man
	\[
		\Sigma = \{0,1,...,n\}.
	\]
	In diesem Modell ist
	\[
		Bin_{n,p}(\{k\}) := \binom{n}{k} p^k (1-p)^{n-k}, \quad k=0,1,..,n
	\]
	eine Zähldichte.
\end{definition}
\begin{definition}{binZähldichte}{\cite{kosenkova_stochastik_2025}}
	Die Wahrscheinlichkeitsverteilung mit der Zähldichte $Bin_{n,p}(\{k\})$ auf $\{0,...,n\}$ heißt Binomialverteilung zu den Parametern $n, p$.
\end{definition}
Anschließend ist folgendes zu bemerken:
\begin{satz}[Verteilung der Endposition]{satz:binomialverteilung}
	Die Wahrscheinlichkeitsverteilung der Zufallsvariable $S_n$, lässt sich durch die Binomialverteilung beschreiben.\\
	Daher gilt $S_n \sim \mathcal{B}in_{n,p}$
\end{satz}
\begin{proof}
	Nach \cref{def:galton} und \cref{def:Sn} ist $S_n$ die Summe von $n$ unabhängigen Bernoulli-verteilten Zufallsvariablen $X_i \sim \mathcal{B}_p$. Also stellt $S_n$ die Anzahl der Erfolge von n-Wiederholungen von unabhängigen identisch Bernoulli-verteilten Zufallsexperimenten dar.
	Daraus folgt, dass das Galton-Brett mit der Zufallsvariable $S_n$ eine Binomialmodell \cref{def:binModell} darstellt und somit die Binomialverteilung nach Definition eine Zähldichte definiert \cref{def:binZähldichte}. Daher gilt: $S_n \sim \mathcal{B}in_{n,p}$
\end{proof}
Für große $n$ wird die direkte Berechnung der Binomialverteilung sehr aufwendig. An dieser Stelle greift der Zentrale Grenzwertsatz, der besagt, dass sich die Binomialverteilung für große $n$ der Normalverteilung annähert. Im Spezialfall der Binomialverteilung wird dies durch den Satz von Moivre-Laplace formalisiert \cite{nahrstedt_monte-carlo-methode_2015, statistik_verstehen_beweis_2019}.
\begin{satz}[Zentraler Grenzwertsatz von de Moivre-Laplace]{moivrelaplace}
	Sei $S_n \sim \mathcal{B}in_{n,p}$ die Anzahl der Erfolge bei $n$ unabhängigen Bernoulli-Versuchen mit Erfolgswahrscheinlichkeit $p \in (0, 1)$ und sei $q = 1-p$. Für große $n$ lässt sich die Wahrscheinlichkeit, dass $S_n$ genau den Wert $k$ annimmt, durch die Dichtefunktion der Normalverteilung annähern:
	\[
	P(S_n = k) = \binom{n}{k} p^k q^{n-k} \approx \frac{1}{\sqrt{2\pi npq}} e^{\left(-\frac{(k-np)^2}{2npq}\right)}
	\]
\end{satz}
\begin{proof}
	Der Beweis folgt zum großen Teil dem Beweis von \cite{statistik_verstehen_beweis_2019} und wurde von den Autoren weiter konkretisiert.\\
	Der Beweis basiert im Wesentlichen auf drei Approximationen: Der Stirling-Formel für die Fakultäten, der Vereinfachung der Wurzelausdrücke für große $n$ sowie der Taylor-Entwicklung des natürlichen Logarithmus zur Herleitung der Exponentialfunktion. Diese 3 Approximationen werden in diesem Beweis als wahr angenommen, jedoch in der Folgenden Arbeit weiter analysiert und bewiesen.

	\textbf{1. Anwendung der Stirling-Formel:} \\
	Wir beginnen mit der Definition der Binomialwahrscheinlichkeit:
	\[
	P(S_n = k) = \frac{n!}{k!(n-k)!} p^k q^{n-k}
	\]
	Nach \cref{satz:stirlingformel} gilt für große Zahlen näherungsweise $n! \approx \sqrt{2\pi n} \left(\frac{n}{e}\right)^n$. Ersetzen wir $n!, k!$ und $(n-k)!$ durch diese Näherung:
	\begin{align}
			P(S_n = k) &\approx \frac{\sqrt{2\pi n} \left(\frac{n}{e}\right)^n}{(\sqrt{2\pi k} \left(\frac{k}{e}\right)^k)(\sqrt{2\pi (n-k)} \left(\frac{(n-k)}{e}\right)^{(n-k)})} p^k q^{n-k} \nonumber \\
			&= \frac{n^n \sqrt{2\pi n}}{k^k \sqrt{2\pi k} (n-k)^{n-k} \sqrt{2\pi (n-k)}} p^k q^{n-k} \label{eq1:e}\\
			&= \frac{\sqrt{n} \cdot n^k \cdot n^{n-k}}{\sqrt{2\pi} \sqrt{k} \sqrt{(n-k)} k^k (n-k)^{n-k}} p^k q^{n-k} \label{eq1:aufteilen}\\
			&= \frac{1}{\sqrt{2\pi}}\sqrt{\frac{n}{k(n-k)}} \left(\frac{np}{k}\right)^k \left(\frac{nq}{n-k}\right)^{n-k} \label{eq1:zusammenfassen}
	\end{align}
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq1:e})] Hier heben sich die $e$-Potenzen heraus, da $\left(\frac{n}{e}\right)^n = n^n \cdot e^{-n}$ sowie $e^n / (e^k e^{n-k}) = 1$ gilt.
		\item[(\ref{eq1:aufteilen})] Hier lässt sich die Gleichung intelligent aufteilen und etwas umstellen durch die Potenzgesetze, da gilt: $n^n = n^k \cdot n^{n-k}$ Außerdem lässt sich einmal $\sqrt{2\pi}$ Kürzen.
		\item[(\ref{eq1:zusammenfassen})] Ist das Resultat nach dem Sortieren der Brüche anhand der Exponenten
	\end{itemize}
	\textbf{2. Substitution und Approximation der Wurzeln:} \\
	Um das breiter werden der Verteilung und das Abwandern des Erwartungswertes zu verhindern standardisieren wir die Zufallsvariable, indem wir
	\[
	Z_n=\frac{S_n-E(S_n)}{\sigma(S_n)} = \frac{k-np}{\sqrt{npq}}
	\]
	definieren. Nun nimmt $Z_n$ Werte $z=\frac{k-np}{\sqrt{npq}}$ an, nach $k$ und nach $n-k$ umgestellt heißt das
	\begin{align*}
		k = np + z\sqrt{npq} \\
		n-k = nq - z\sqrt{npq}
	\end{align*}
	Nun betrachten wir $k \cdot (n-k)$ für $n \rightarrow \infty$:
	\begin{align}
		k(n-k) &= (np + z\sqrt{npq})\cdot(nq - z\sqrt{npq}) \label{eq3:einsetzen}\\
		&= n^2pq + (nz\sqrt{nqp}(q-p)-z^2npq)	\label{eq3:umstellen}\\
		&\overset{n\rightarrow\infty}{=}n^2pq + O(n) \label{eq3:absch}
	\end{align}
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq3:einsetzen})] Formeln für $k$ und $n-k$ einsetzen
		\item[(\ref{eq3:umstellen})] Distributivgesetz anwenden und nach Potenz von $n$ sortieren
		\item[(\ref{eq3:absch})] $n^2$ geht für $n\rightarrow\infty$ schneller nach unendlich als die linearen Restterme. Folglich sind diese für die Abschätzung gegen unendlich vernachlässigbar.
	\end{itemize}
	Setzen wir dieses Ergebnis nun in das Zwischenergebnis von \cref{eq1:zusammenfassen} ein erhalten wir folgendes:
	\begin{align}
		P(S_n = k) &= \frac{1}{\sqrt{2\pi}}\sqrt{\frac{n}{k(n-k)}} \left(\frac{np}{k}\right)^k \left(\frac{nq}{n-k}\right)^{n-k} \nonumber \\
		&\approx \frac{1}{\sqrt{2\pi}}\sqrt{\frac{n}{n^2pq}} \left(\frac{np}{k}\right)^k \left(\frac{nq}{n-k}\right)^{n-k} \label{eq4:1}\\
		&= \frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{npq}} \left(\frac{np}{k}\right)^k \left(\frac{nq}{n-k}\right)^{n-k} \label{eq4:2}\\
		&= \frac{1}{\sqrt{2\pi npq}}\left(\frac{k}{np}\right)^{-k} \left(\frac{n-k}{nq}\right)^{-n+k} \label{eq4:3}
	\end{align}
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq4:1})] Approximation verwenden
		\item[(\ref{eq4:2})] $n$ Kürzen und Potenz-/Wurzelgesetze anwenden um Bruch zu vereinfachen
		\item[(\ref{eq4:3})] Kehrwert der Brüche Bilden und Wurzeln zusammenfassen
	\end{itemize}
	Es ist bereits der korrekte konstante Faktor der Gaußschen Glockenkurve erkennbar.\\
	\textbf{3. Taylor-Approximation des exponentiellen Teils:} \\
	Den restlichen Term formen wir um, indem wir ihn logarithmieren um im Anschluss die Approximationsformel für den Logarithmus verwenden zu können. Diese wird ebenso wie die Stirling-Formel im Anschluss bewiesen.
	Hierzu betrachten wir folgendes zuerst einzeln:
	\begin{align}
		&\ln\left( \left(\frac{k}{np}\right)^{-k} \left(\frac{n-k}{nq}\right)^{-n+k} \right) \label{eq5:1} \\
		&= -k \ln\left(\frac{k}{np}\right) - (n-k) \ln\left(\frac{n-k}{nq}\right) \label{eq5:2}\\
		&= -(np + z\sqrt{npq}) \ln\left(\frac{(np + z\sqrt{npq})}{np}\right) - (nq - z\sqrt{npq}) \ln\left(\frac{(nq - z\sqrt{npq})}{nq}\right) \label{eq5:3}\\
		&= (-np - z\sqrt{npq}) \ln\left(1+z\sqrt{\frac{q}{np}}\right) + (-nq + z\sqrt{npq}) \ln\left(1-z\sqrt{\frac{p}{nq}}\right) \label{eq5:4}
	\end{align}
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq5:1})] logarithmieren
		\item[(\ref{eq5:2})] Logarithmengesetze für Potenzen anwenden.
		\item[(\ref{eq5:3})] Gleichheit für $k$ aus der Standardisierung einsetzen: $k = np + z\sqrt{npq}$.
		\item[(\ref{eq5:4})] Distributivgesetz für $-1$ anwenden und Brüche durch Aufteilen der Addition und Einfügen der multiplikativen Identität $\frac{\sqrt{np}}{\sqrt{np}}$ (selbes für $nq$) vereinfachen.
	\end{itemize}
	\cref{def:taylorpolynom} beweist die Taylor-Approximation für den Logarithmus: $ln(1-\alpha) \approx \alpha-\frac{\alpha^2}{2}+O(\alpha^3)$ Hierbei steht $O(\alpha^3)$ für die Landau-Notation.
	Wir definieren
	\[
		\beta := \sqrt{\frac{q}{np}}; \quad
		\gamma := \sqrt{\frac{p}{nq}}
	\]
	Um diese Approximation zu verwenden, muss sicher sein, dass $|\alpha| < 1$. Das heißt, dass $\forall z \in \mathbb{R}: |z\cdot\beta| \overset{n\rightarrow\infty}{<}1$. (Für $z\cdot\gamma$ analog) Hierbei genügt die Abschätzung gegen unendlich, da wir die Annäherung nur für große Zahlen beweisen wollen.\\
	Sei also $z\in\mathbb{N}$, dann betrachten wir:\\
	\begin{align*}
		|z\cdot\beta| \overset{Def.}{=} \left|z \cdot \sqrt{\frac{q}{np}}\right| = |z|\cdot \frac{1}{\sqrt{n}}\cdot\sqrt{\frac{q}{p}} \xrightarrow{n\rightarrow\infty} 0 < 1
	\end{align*}
	Da $p$ und $q$ konstante Parameter sind.

	Betrachten wir nun die Logarithmen für die Taylor-Approximation näher:
	\begin{align*}
		\ln\left(1 + z\sqrt{\frac{q}{np}}\right) &\approx z\sqrt{\frac{q}{np}} - \frac{\left(z\sqrt{\frac{q}{np}}\right)^2}{2} + O((z\beta)^3)\\
		&= z\sqrt{\frac{q}{np}} - \frac{z^2 q}{2np} + O((z\beta)^3)
	\end{align*}
	und für den anderen ln analog:
	\begin{align*}
		\ln\left(1 - z\sqrt{\frac{p}{nq}}\right) &\approx -z\sqrt{\frac{p}{nq}} - \frac{\left(z\sqrt{\frac{p}{nq}}\right)^2}{2} + O((-z\gamma)^3) \\
		&= -z\sqrt{\frac{p}{nq}} - \frac{z^2 p}{2nq} + O((z\gamma)^3) &&\text{"-" fällt wegen O weg}
	\end{align*}
	Setzen wir dies nun zurück in \cref{eq5:3} ein, erhalten wir:
	\begin{align}
		&(-np - z\sqrt{npq}) \ln\left(1+z\sqrt{\frac{q}{np}}\right) + (-nq + z\sqrt{npq}) \ln\left(1-z\sqrt{\frac{p}{nq}}\right)+O(z^3) \nonumber \\
		&=(-np - z\sqrt{npq})(z\sqrt{\frac{q}{np}} - \frac{z^2 q}{2np} + O((z\beta)^3)) \nonumber \\ &\quad + (-nq + z\sqrt{npq}))(-z\sqrt{\frac{p}{nq}} - \frac{z^2 p}{2nq} + O((z\gamma)^3)) + O(z^3) \nonumber \\
		&=(-npz\sqrt{\frac{q}{np}}+\frac{npz^2q}{2np}-z^2\sqrt{npq}\sqrt{\frac{q}{np}} + O((z\beta)^3)) + O(z^3) \nonumber\\ &\quad + (nqz\sqrt{\frac{p}{nq}}+\frac{nqz^2p}{2nq}-z^2\sqrt{npq}\sqrt{\frac{p}{nq}} + O((z\gamma)^3))\nonumber \\ &\quad + (-np - z\sqrt{npq}) \cdot O((z\beta)^3) + (-nq + z\sqrt{npq}) \cdot O((z\gamma)^3)\label{eq6:1}\\
		&=(-z\sqrt{\frac{(np)^2q}{np}}+\frac{z^2q}{2}-z^2\sqrt{\frac{npq^2}{np}}+O((z\beta)^3)) \nonumber \\ &\quad + (z\sqrt{\frac{(nq)^2p}{nq}}+\frac{z^2p}{2}-z^2\sqrt{\frac{np^2q}{nq}} + O((z\gamma)^3)) \nonumber \\ &\quad + (-np - z\sqrt{npq}) \cdot O((z\beta)^3) + (-nq + z\sqrt{npq}) \cdot O((z\gamma)^3) \label{eq6:2}\\
		&=(-z\sqrt{npq}-z^2q+\frac{z^2q}{2} + O((z\beta)^3)) + (z\sqrt{npq}-z^2p+\frac{z^2p}{2} + O((z\gamma)^3))\nonumber \\ &\quad + (-np - z\sqrt{npq}) \cdot O((z\beta)^3) + (-nq + z\sqrt{npq}) \cdot O((z\gamma)^3)\label{eq6:3} \\
		&\approx (-z\sqrt{npq}-\frac{z^2q}{2}) + (z\sqrt{npq}-\frac{z^2p}{2})\label{eq6:4}\\
		&=-\frac{z^2q}{2}-\frac{z^2p}{2} = -\frac{z^2}{2}(p+q) \label{eq6:5}\\
		&=-\frac{z^2}{2} \label{eq6:6}
	\end{align} %(-np - z\sqrt{npq}) \cdot O((z\beta)^3) + (-nq + z\sqrt{npq}) \cdot O((z\gamma)^3)
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq6:1})] Distributivgesetz
		\item[(\ref{eq6:2})] $np$ und $nq$ mithilfe des Quadrates in die Wurzel ziehen, sowie Kürzen und Wurzeln zusammenfassen. Alle Terme mit $z^3$ werden von $O(z^3)$ nach dessen Definition "absorbiert".
		\item[(\ref{eq6:3})] $np$ und $nq$ in den Wurzeln Kürzen und Kommutativgesetz anwenden
		\item[(\ref{eq6:4})] Die Landau Terme können vernachlässigt werden, da diese Terme für $n\rightarrow\infty$ gegen 0 gehen. Betrachte Hierzu \cref{lem:restterme} und \cref{prop:restterme2}.
		\item[(\ref{eq6:5})] $-z\sqrt{npq}+z\sqrt{npq}=0$ und Distributivgesetz (invers)
		\item[(\ref{eq6:6})] $p+q=1$ da $q = 1-p$ definiert wurde.
	\end{itemize}
	Da $e^{ln(l)} = l$ setzen wir nun $e^{-\frac{z^2}{2}}$ in \cref{eq4:3} ein kommen wir zum finalen Ergebnis:
	\begin{align}
		P(S_n = k) &\approx \frac{1}{\sqrt{2\pi npq}}e^{-\frac{z^2}{2}} \nonumber \\
		&= \frac{1}{\sqrt{2\pi npq}}e^{-\frac{\left(\frac{k-np}{\sqrt{npq}}\right)^2}{2}} \label{eq7:1} \\
		&= \frac{1}{\sqrt{2\pi npq}}e^{\left(-\frac{(k-np)^2}{2npq}\right)} \label{eq7:2}
	\end{align}
	Im Folgenden werden die nummerierten Schritte der Gleichungsketten erläutert:
	\begin{itemize}
		\item[(\ref{eq7:1})] Rücksubstitution der Standardisierung.
		\item[(\ref{eq7:2})] Der Bruch wurde quadriert und zusammengefasst.
	\end{itemize}
	Daher konvergiert eine Binomialverteilte Zufallsvariable (für $n\rightarrow\infty$) gegen die Dichtefunktion der Normalverteilung.
\end{proof}
\begin{lemma}[Asymptotisches Verschwinden der Taylor-Restterme mit Präfix]{restterme}
	Seien $p \in (0,1)$, $q = 1-p$ und $z \in \mathbb{R}$ fest gewählt. Für die Restterme der Taylor-Entwicklung des Logarithmus multipliziert mit ihren jeweiligen Vorfaktoren gilt für $n \rightarrow \infty$:
	\[
	(-np - z\sqrt{npq}) \cdot O((z\beta)^3) + (-nq + z\sqrt{npq}) \cdot O((z\gamma)^3) \xrightarrow{n \rightarrow \infty} 0
	\]
	wobei $\beta = \sqrt{\frac{q}{np}}$ und $\gamma = \sqrt{\frac{p}{nq}}$ definiert sind.
\end{lemma}
\begin{proof}
	Wir betrachten exemplarisch den ersten Summanden (der zweite verhält sich vollkommen analog). Da $\beta = \sqrt{\frac{q}{np}}$, verhält sich der Restterm dritter Ordnung bezüglich $n$ wie folgt:
	\[
	O((z\beta)^3) = O\left(z^3\cdot\left(\sqrt{\frac{q}{np}}\right)^3\right) = O\left(\frac{z^3 q^{3/2}}{p^{3/2}}\cdot\frac{1}{n^{3/2}}\right) \subseteq O\left(n^{-3/2}\right)
	\]
	Nach der Definition der Landau-Notation existiert für hinreichend große $n$ eine Konstante $C > 0$, sodass der Betrag dieses Restterms durch $C \cdot n^{-3/2}$ nach oben beschränkt ist.
	Multiplizieren wir dies mit dem Betrag des Vorfaktors, erhalten wir mithilfe der Dreiecksungleichung:
	\begin{align*}
		\left| (-np - z\sqrt{npq}) \cdot O((z\beta)^3) \right| &\leq (np + |z|\sqrt{npq}) \cdot C \cdot n^{-3/2} \\
		&= C \cdot np \cdot n^{-3/2} + C \cdot |z|\sqrt{npq} \cdot n^{-3/2} \\
		&= C \cdot p \cdot \frac{1}{\sqrt{n}} + C \cdot |z|\sqrt{pq} \cdot \frac{1}{n}
	\end{align*}
	Da $C, p, q$ und $z$ von $n$ unabhängige Konstanten sind und $n$ im Nenner unbegrenzt wächst, strebt dieser Ausdruck für $n \to \infty$ gegen:
	\[
	0 + 0 = 0
	\]
	Für den zweiten Term mit $\gamma$ erfolgt der Beweis völlig analog, womit die Summe beider Terme ebenfalls gegen $0$ konvergiert.
\end{proof}

Folgende Proposition ich leicht aus dem oberen Beweis ableitbar (aufgrund der Abschätzung mit $n^{-3/2}$ und der Betrachtung von z als beliebig aber fest) und wird daher nicht separat bewiesen.
\begin{proposition}[Asymptotisches Verschwinden der Taylor-Restterme ohne Präfix]{restterme2}
	Seien $p \in (0,1)$, $q = 1-p$ und $z \in \mathbb{R}$ fest gewählt. Für die Restterme der Taylor-Entwicklung des Logarithmus gilt für $n \rightarrow \infty$:
	\[
	O((z\beta)^3) + O((z\gamma)^3) \xrightarrow{n \rightarrow \infty} 0
	\]
	\[
	O(z^3) \xrightarrow{n \rightarrow \infty} 0
	\]
	wobei $\beta = \sqrt{\frac{q}{np}}$ und $\gamma = \sqrt{\frac{p}{nq}}$ definiert sind.
\end{proposition}


% Teilsortiert:
\subsection{Pascalsches Dreieck}
Das Pascalsche Dreieck ist ein geometrisches Dreieck aus Zahlen, das sich unendlich nach unten fortsetzt und dabei die Binomialkoeffizienten repräsentiert.
\begin{definition}[Binomialkoeffizienten\footnote{Kosenkova, T: Stochastik für das Lehramt (Vorlesung 4), 2025}]{binomialkoeffizienten}
	Für $n\in\mathbb{N}_0$ und $k\in\{0,\dots,n\}$ definieren wir den \textbf{Binomialkoeffizienten}
	\[
		\binom{n}{k}=\frac{n!}{k!(n-k)!}
	\]
	wobei die Zahl $\binom{n}{k}$ die Anzahl der Möglichkeiten, aus einer $n$-elementigen Menge genau $k$-Elemente auszuwählen, angibt.
\end{definition}
Aus dieser Definition entwickeln wir das Pascalsche Dreieck.
\begin{definition}[Pascalsches Dreieck]{pascaldreieck}
	Das \textbf{Pascalsche Dreieck} ist das unendliche Zahlenschema
	\[
		P=(p_{n,k})_{n\in\mathbb{N}_0,0\leq k\leq n}
	\]
	mit
	\[
		p_{n,k}=\binom{n}{k}
	\]
\end{definition}
Die ersten Zeilen des Pascalschen Dreiecks lauten
\[
\begin{array}{ccccccccc}
	&&&&1\\
	&&&1&&1\\
	&&1&&2&&1\\
	&1&&3&&3&&1\\
	1&&4&&6&&4&&1
\end{array}
\]
\begin{satz}[Pascalsche Rekursion]
	Für $n\geq1$ und $1\leq k\leq n-1$ gilt
	\[
		\binom{n}{k} = \binom{n-1}{k-1}+\binom{n-1}{k}
	\]
\end{satz}
\begin{bemerkung}
	Diese Beziehung erklärt die Entstehung jeder inneren Zahl als Summe der beiden darüberliegenden Zahlen.
\end{bemerkung}
\begin{proof}
	Sei $M$ eine Menge mit $n$ Elementen. Wähle $x\in M$ fest.

	Wir zählen die $k$-elementigen Teilmengen von M.
	\begin{itemize}
		\item Enthält eine Teilmenge das Element $x$, dann müssen noch $k-1$ Elemente aus den $n-1$ verbleibenden Elementen gewählt werden. Wir erhalten
		\[
			\binom{n-1}{k-1}
		\]
		\item Enthält eine Teilmenge das $x$ nicht, werden $k$ Elemente aus den verbleibenden $n-1$ Elementen gewählt, also
		\[
			\binom{n-1}{k}
		\]
	\end{itemize}
	Aufrund der Disjunkteit beider Fälle und der Erfassung aller $k$-elementigen Teilmengen, folgt
	\[
		\binom{n}{k} = \binom{n-1}{k-1}+\binom{n-1}{k}
	\]
\end{proof}

\subsection{Taylor-Approximation}
Um eine Taylorpproximation für eine Funktion zu finden, müssen wir zunächst nachweisen, dass die Funktion die wir approximieren wollen, $(n+1)$-mal differenzierbar ist. Da wir unsere Approximation nach dem quadratischen Term abbrechen werden genügt es zu zeigen, dass $\ln(1-x)$ dreimal differenzierbar ist.
\begin{lemma}{dreimalableiten}
	$f(x)=\ln(1-x)$ ist mindestens dreimal differenzierbar.
\end{lemma}
\begin{proof}
	Zum Beweis berechnen wir die drei Ableitungen.
	\begin{align*}
		f'(x)&=(\ln{(1-x)})'\\
		&=\frac{1}{1-x}\cdot(1-x)'&&\text{Kettenregel}\\
		&=-\frac{1}{1-x}\\\\
		f''(x)&=(f'(x))'\\
		&=\left(-\frac{1}{1-x}\right)'\\
		&=\frac{(-1)'\cdot(1-x)-(-1)\cdot(1-x)'}{(1-x)^2}&&\text{Quotientenregel}\\
		&=\frac{(1-x)'}{(1-x)^2}&&\text{da } (-1)'\cdot(1-x)=0\\
		&=\frac{1}{(1-x)^2}\\\\
		f'''(x)&=(f''(x))'\\
		&=(\frac{1}{(1-x)^2})'\\
		&=\frac{(-1)'\cdot(1-x)^2-(-1)\cdot\left((1-x)^2\right)'}{\left((1-x)^2\right)^2}&&\text{Quotientenregel}\\
		&=\frac{\left((1-x)^2\right)'}{(1-x)^4}&&\text{da } (-1)'\cdot(1-x)^2=0\\
		&=\frac{-2\cdot(1-x)}{(1-x)^4}&&\text{Kettenregel}\\
		&=\frac{-2}{(1-x)^3}
	\end{align*}
\end{proof}
Nun haben wir nachgewiesen, dass die Funktion $\ln(1-x)$ dreimal differenzierbar ist.
\begin{bemerkung}
	Mit einem Blick auf die Funktion und wie ihre Ableitungen gebildet werden, ist leicht zu erkennen, dass $\ln(x-1)$ sogar unendlich oft differenzierbar ist.
\end{bemerkung}
Bevor wir die Approximation  nachweisen ist eine formale Definition des Satzes von Taylor und dem Taylorpolynom nötig, wobei letzteres aus dem Satz von Taylor folgt.
\begin{satz}[Satz von Taylor\footnote{Enders, J., Analysis II (2024)}]{taylor}
	Seien $n\in\mathbb{N}_0, f:[a,b]\rightarrow\mathbb{R}$ eine $(n+1)$-mal differenzierbare Funktion und $x_0\in[a,b]$.

	Dann gilt für alle $x\in[a,b]$ die Darstellung
	\[
		f(x)=\sum_{k=0}^{n}\frac{1}{k!}f^{(k)}(x_0)(x-x_0)^k+R_n(x)
	\]
	Es existiert ein (von $x$ abhängiges $\xi\in I(x_0,x)$), sodass für das Lagrange-Restglied gilt:
	\[
		R_n(x)=\frac{1}{(n+1)!}f^{(n+1)}(\xi)(x-x_0)^{n+1}
	\]
\end{satz}

\begin{bemerkung}
	Das Lagrange-Restglied ist in dein meisten Fällen eine Funktion vom Grad $n+1$, aufgrund des letzten Faktors. Es kann aber auch sein, dass das Lagrange-Restglied das Nullpolynom ist, je nach Wahl von $\xi$ und der Auswertung von der $n$-ten Ableitung von $f$ an der Stelle $\xi$.

	Dadurch können wir das Restglied auch auffassen als ein Element von $O(x^n)$. Nach der Definition der Landaunotation gilt: für alle $a,b in \mathbb{R}: a*x^n +b$ liegt in $O(x^n)$. Man kann somit das Landausymbol $O$ als Ansammlung von Funktionen verstehen. Interessanterweise gilt auch eine Relation zwischen den einzelnen "Landaumengen". Für alle $n$ in $\mathbb{N}: O(x^n)$ ist in $O(x^{n+1})$. In der Informatik wird diese Notation genutzt, um asymptotische Verhalten von beispielsweise Laufzeiten zu beschreiben. "Algortihmus A braucht asymptotisch so viel Zeit in Abhängigkeit von der Eingabe, wie eine $x^n$-Funktion".

	Die Definition des Taylorpolynoms entspringt direkt dem Satz von Taylor, nur ohne das Lagrange-Restglied.
\end{bemerkung}
\begin{definition}[Taylorpolynom]{taylorpolynom}
	\[
		T_{f,x_0,n}(x)=\sum_{k=0}^{n}\frac{1}{k!}\cdot f^{(k)}(x_0)(x-x_0)^k
	\]
\end{definition}
\begin{bemerkung}
	Der Satz von Taylor liefert eine lokale Approximation an eine Funktion $f$ durch das Taylorpolynom.
\end{bemerkung}
Nun können wir unsere Approximation von $\ln(1-x)=-x-\frac{x^2}{2}+O(x^3)$ zeigen.
\begin{lemma}
	\[
		\ln(1-x)=-x-\frac{x^2}{2}+O(x^3)
	\]
\end{lemma}
\begin{proof}
	Zunächst ist der Definitionsbereich von $\ln(1-x)$ gleicht dem Intervall $(-\infty,1)$.

	Zudem ist die Funktion $\ln(1-x)$ mindestens dreimal differenzierbar. Betrachten wir $x\in(-\infty,1)$ und $x_0=0$.

	Das zweite Taylor-Polynom lautet
	\begin{align*}
		T_{\ln(1-x),0,2}(x)&=\sum_{k=0}^{2}\frac{1}{k!}\cdot (\ln(1-x_0))^{(k)}(x-x_0)^k\\
		&=\frac{1}{0!}\cdot\ln(1)\cdot 1+\frac{1}{1!}\cdot(\ln(1))^{(1)}\cdot x+\frac{1}{2!}\cdot(\ln(1))^{(2)}\cdot x^2&&\text{\cref{lem:dreimalableiten}}\\
		&=0+1\cdot(-1)\cdot x+\frac{1}{2}\cdot(-1)\cdot x^2\\
		&=-x-\frac{x^2}{2}
	\end{align*}
	Aus dem Satz von Taylor (\cref{satz:taylor}) folgt somit:
	\begin{align*}
		\ln(1-x)&=-x-\frac{x^2}{2}+R_2(x)
	\end{align*}
	wobei das Lagrange-Restglied etwa $R_2(x)\approx O(x^3)$, denn
	\begin{align*}
		R_2(x)&=\frac{1}{(2+1)!}\cdot(\ln(1-\xi))^{(2+1)}\cdot(x-0)^{(2+1)}\\
		&=-\frac{1}{3(1-\xi)^3}\cdot x^3\quad\text{für ein }\xi\in(0,x)&&\text{\cref{lem:dreimalableiten}}\\
	\end{align*}
	wobei nach der Landau-Notation gilt: $a\cdot x^n+b\in O(x^n)$
	\[
		\Rightarrow\quad \frac{1}{3(1-\xi)^3}\cdot x^3\in O(x^3),
	\]
	da $\frac{1}{3(1-\xi)^3}$ konstant für ein $\xi$ im Intervall.

	Da $\xi$ variabel ist (also von $x$ abhängt), steht $O(x^3)$ stellvertretend für ein gut passendes Polynom vom Grad 3.
	\[
		\Rightarrow\quad\ln(1-x)\approx -x -\frac{x^2}{2}+O(x^3)
	\]
\end{proof}
\begin{bemerkung}
	Aus der Definition folgt die Gleichheit beider Funktionen, aber genauer betrachtet kann die ln-Funktion nicht durch ein Polynom dargestellt werden. Es wird immer einen gewissen Fehler geben. Da auch in abhängigkeit von $x$ das $\xi$ gewählt wird, handelt es sich bei dem Lagrange-Restglied nicht um ein Polynom, weil es sich dynamisch verändert.
\end{bemerkung}
Im Plot können wir sehen, dass beide Funktionen um unsere Entwicklungsstelle $x_0=0$ herum sehr ähnlich sind.
\begin{figure}[H]
	\centering
	\begin{tikzpicture}
		\begin{axis}[
			domain=-2.95:2.95,
			samples=400,
			axis lines=middle,
			axis equal,
			xmin=-3,
			xmax=3,
			ymin=-3.5,
			ymax=3.5,
			xtick distance=1,
			ytick distance=1,
			legend pos=south west,
			grid=both
			]
			% ln(1-x)
			\addplot[blue, thick] {ln(1-x)};
			\addlegendentry{$\ln(1-x)$}

			% Näherung -x - x^2/2
			\addplot[red, thick, dashed] {-x - x^2/2};
			\addlegendentry{$-x-\frac{x^2}{2}$}
		\end{axis}
	\end{tikzpicture}
	\caption{Darstellung der Funktionen $\ln(1-x)$ und $-x-\frac{x^2}{2}$}
\end{figure}
Würden wir die Entwicklung weiterführen, approximiert die violette Funktion (unser Taylorpolynom) die orangene Funktion $(\ln(1-x))$ immer weiter. Graphisch lässt sich erkennen, dass für Werte im Intervall $I(-0.5,0.5)$ die Funktion $\ln(1-x) \approx -x\frac{-x}{2}$ plus ein kleiner Fehler ist.
\subsection{Gamma-Funktion}
% wird für Beweis der Stirling-Approximation gebraucht
Zum nachfolgenden Betrachtung und des Beweises der Stirling-Approximation betrachten wir nun die Gamma-Funktion, auch \textbf{Eulersches Integral zweiter Gattung} genannt. Sie erweitert die Fakultätsfunktion von den natürlichen Zahlen $\mathbb{N}$ auf reelle und komplexe Zahlen (mit einigen Ausnahmen). Hier betrachten wir der Einfachheit halber nur die Gamma-Funktion in $\mathbb{R}$.
\begin{definition}[Gamma-Funktion]{gammafunktion}
	Sei $x>0\in\mathbb{R}$, dann ist die \textbf{Gamma-Funktion} definiert durch
	\begin{align*}
		\Gamma(x):\mathbb{R^+}&\rightarrow\mathbb{R}\\
		x&\mapsto\int_{0}^{\infty}t^{x-1}e^{-t} dt
	\end{align*}
\end{definition}

Die Gamma-Funktion berechnet wie folgt die Fakultät in $\mathbb{N}$:
\begin{satz}[Vergleich mit der Fakultät]{fakultaetgammafunktion}
	Für $n\in\mathbb{N}$ gilt:
	\[
		\Gamma(n+1)=n!
	\]
\end{satz}

\subsection{Stirling-Approximation}
Die Stirling-Approximation ist eine mathematische Näherung zur Berechnung der Fakultät einer Zahl. Die Approximation ist vorallem in der Stochastik und der statistischen Physik ein unverzichtbares Werkzeug. Wir schauen sie daher im Folgenden im Detail an.
\begin{satz}[Stirlingformel]{stirlingformel}
	Für $n\mapsto\infty$ gilt nach \textsc{Stirlings} Approximation, dass
	\[
		n!\approx \sqrt{2\pi n}\left(\frac{n}{e}\right)^n
	\]
	Das bedeutet
	\[
		\lim_{n\rightarrow\infty}\frac{n!}{\sqrt{2\pi n}\left(\frac{n}{e}\right)^n}=1
	\]
\end{satz}
\begin{proof}
	Der Ausgangspunkt ist die nach \cref{def:gammafunktion} definierte \textbf{Gamma-Funktion}
	\[
		\Gamma(x)=\int_{0}^{\infty}t^{x-1}e^{-t} dt
	\]
	Wir schreiben den Integranden als Exponentialfunktion, dann haben wir
	\[
		t^{x-1}e^{-t} = \exp((x-1)\ln t-t)
	\]
	also ist
	\[
	\Gamma(x)=\int_{0}^{\infty}\exp((x-1)\ln t-t) dt
	\]
	Setze $t=xu$ und $f(u)=\ln u - u$, dann erhalten wir
	\begin{align}
		\Gamma(x)&=x^x\cdot\int_{0}^{\infty}u^{x-1}e^{-xu} du\\
		&=x^x\cdot\int_{0}^{\infty}\exp(x(\ln u-u)) du\\
		&=x^x\cdot \int_{0}^{\infty} e^{xf(u)}du
	\end{align}

	Für große \(x\) wird das Integral durch die Umgebung des kritischen Punktes von \(f\) dominiert. Diese erhält man aus
	\[
	f'(u)=\frac{1}{u}-1=0 \quad \Rightarrow \quad u=1.
	\]

	Weiter gilt
	\[
	f''(u)=-\frac{1}{u^2}, \quad \text{also } f''(1)=-1.
	\]

	Damit besitzt \(f\) bei \(u=1\) einen stationären Punkt, und wir entwickeln \(f\) dort bis zur zweiten Ordnung:
	\[
	f(u)\approx f(1)+\frac{f''(1)}{2}(u-1)^2
	= -1 - \frac{(u-1)^2}{2}.
	\]

	Einsetzen liefert die lokale Approximation
	\[
	\Gamma(x)\approx x^x e^{-x}\cdot\int_0^\infty \exp\!\left(-\frac{x}{2}(u-1)^2\right)\,du.
	\]

	Da der Hauptbeitrag aus einer Umgebung von $u=1$ stammt, kann das Integral asymptotisch auf $\mathbb{R}$ erweitert werden.
	\[
	\int_{-\infty}^{\infty} \exp\!\left(-\frac{x}{2}(u-1)^2\right)\,du
	= \sqrt{\frac{2\pi}{x}}.
	\]

	Damit erhält man
	\[
	\Gamma(x)\sim \sqrt{2\pi}\, x^{x-\frac12} e^{-x}.
	\]

\end{proof}