Schätztheorie

Einleitung

Die Schätztheorie ist ein zentraler Bereich der schließenden Statistik, der sowohl in theoretischen als auch in angewandten Kontexten eine große Bedeutung zukommt. Die Methoden der Schätztheorie zielen darauf ab, unbekannte Parameter von Wahrscheinlichkeitsverteilungen basierend auf Stichprobendaten zu schätzen und ermöglichen dadurch Rückschlüsse auf die gesamte Population. Diese Techniken bilden zudem die Grundlage für die Durchführung von Hypothesentests, die in nachfolgenden Kapiteln ausführlich behandelt werden.

Schätzverfahren lassen sich typischerweise in zwei Hauptkategorien einteilen: die Punktschätzung und die Intervallschätzung. Die Punktschätzung zielt darauf ab, einen einzelnen Schätzwert als Näherung für einen unbekannten Parameter zu bestimmen. Beispiele hierfür sind der Stichprobenmittelwert oder die Stichprobenvarianz, die jeweils als Schätzungen für den Erwartungswert bzw. die Varianz der Grundgesamtheit dienen.

Im Gegensatz dazu liefert die Intervallschätzung einen Wertebereich, der den wahren Parameter mit einer vorgegebenen Sicherheit überdeckt. Diese Schätzintervalle berücksichtigen die inhärente Unsicherheit in einer Schätzung.

Ein Praxisbeispiel für die Anwendung von Punkt- und Intervallschätzungen findet sich unter anderem in der medizinischen Forschung. Beispielsweise kann in einer Studie der Blutdruck von Personen gemessen werden, um den durchschnittlichen (systolischen) Blutdruck in einer Population zu schätzen. Dazu wird in einer Stichprobe von 100 Personen der Mittelwert des Blutdrucks berechnet. Dieser Stichprobenmittelwert dient als Punktschätzung für den unbekannten wahren Mittelwert des Blutdrucks in der gesamten Population. Darüber hinaus könnte ein 95%-Konfidenzintervall berechnet werden. Dieses Intervall gibt einen Bereich an, der den wahren Mittelwert mit einer Wahrscheinlichkeit von 95% überdeckt. Durch diese Berechnungen kann nicht nur eine Schätzung des Blutdrucks angegeben, sondern auch die Unsicherheit dieser Schätzung quantifiziert werden.

In diesem Kapitel werden zunächst die Konzepte der Punktschätzung und anschließend die der Intervallschätzung behandelt. Beide Verfahren werden exemplarisch für die Schätzung des Erwartungswerts und der Varianz einer Normalverteilung erläutert.

Das Ziel dieses Kapitels ist es, ein grundlegendes Verständnis für Parameterschätzungen zu vermitteln, welches auch auf die Schätzung weiterer Parameter wie den Median, den Modus oder Proportionen übertragen werden kann. Weitere Informationen zu diesen Parameterschätzungen finden sich in den Lehrbüchern von Papula (2016), Lange und Mosler (2017), Dietmaier (2014) und Bankhofer und Vogel (2008), auf die sich auch der Inhalt dieses Kapitels stützt.

Nach den theoretischen Erläuterungen folgt ein praktisches Beispiel, das die Anwendung der Schätztheorie unter Verwendung der statistischen Softwaretools R und SPSS demonstriert.

Punktschätzung

Die Punktschätzung zielt darauf ab, einen einzelnen, optimalen Schätzwert für einen unbekannten statistischen Parameter $\vartheta$ einer Grundgesamtheit zu ermitteln. Dieser Parameter könnte beispielsweise der Erwartungswert $\mu$ oder die Varianz $\sigma^2$ sein. Die Basis für solche Schätzungen bilden die Stichprobenwerte $y_1, y_2, \ldots, y_n$ , die aus der zu untersuchenden Grundgesamtheit mit dem Merkmal $Y$ stammen. Diese Stichprobenwerte können als die realisierten Werte der Zufallsgrößen $Y_1, Y_2, \ldots, Y_n$ betrachtet werden, die alle stochastisch unabhängig sind und dieselbe Verteilung aufweisen. Der Stichprobenumfang wird durch die Zahl $n$ repräsentiert.

Mittels einer adäquaten Schätzfunktion $g$ , die von den Stichprobenwerten abhängt, wird eine Punktschätzung $\hat{\vartheta}$ für den unbekannten Parameter bestimmt:

$\hat{\vartheta} = g(y_1, y_2, \ldots, y_n).$

Punktschätzwerte werden üblicherweise mit einem Dachsymbol gekennzeichnet, wie $\hat{\mu}$ für den Parameter $\mu$ .

Das Ergebnis einer Schätzung hängt von der konkreten Stichprobe ab. Zieht man wiederholt Stichproben gleichen Umfangs aus derselben Grundgesamtheit, variiert der Punktschätzwert von Stichprobe zu Stichprobe, was zu einer Stichprobenverteilung des geschätzten Parameters führt. Der Zufallscharakter des Ergebnisses von Schätzfunktionen wird an dieser Stelle deutlich und spielt auch in der später behandelten Intervallschätzung eine Rolle. Setzt man die Zufallsvariablen $Y_1, Y_2, \ldots, Y_n$ in die Schätzfunktion ein, wird der Zufallscharakter des Ergebnisses deutlich, was durch die Großbuchstabennotation $\Theta$ ausgedrückt wird:

$\Theta = g(Y_1, Y_2, \ldots, Y_n).$

Funktionen, die von Zufallsvariablen abhängen, werden als Stichprobenfunktionen bezeichnet. Schätzfunktionen oder Schätzer sind spezielle Stichprobenfunktionen, die aufgrund ihrer spezifischen Eigenschaften zur Schätzung eines Parameters der Population geeignet sind.

Gewinnung von Schätzfunktionen

Die Schätztheorie untersucht, wie man geeignete, optimale Schätzfunktionen bestimmt. Es existieren verschiedene Ansätze zur Gewinnung von Schätzfunktionen, wobei die Maximum-Likelihood-Methode eine der bedeutendsten ist. Diese Methode geht davon aus, dass die vorliegende Stichprobe unter allen möglichen Stichproben die größte Wahrscheinlichkeit besitzt, aufzutreten. Diese Methode wird in den zuvor genannten Lehrbüchern detailliert behandelt. In diesem Kapitel konzentrieren wir uns jedoch nur auf die Ergebnisse, die durch derartige Methoden gewonnen werden.

Güte von Schätzfunktionen

Die Qualität einer Schätzfunktion wird anhand verschiedener Kriterien beurteilt. Nachfolgend sind einige wichtige Kriterien aufgelistet:

Erwartungstreue: Eine Schätzfunktion wird als erwartungstreu oder unverzerrt bezeichnet, wenn ihr Erwartungswert dem wahren Parameterwert entspricht. Erwartungstreue Schätzfunktionen würden bei ausreichend häufiger Wiederholung der Schätzung im Durchschnitt den wahren Parameterwert liefern.
Konsistenz: Eine Schätzfunktion ist konsistent, wenn sie mit zunehmender Stichprobengröße gegen den wahren Parameterwert konvergiert. Konsistente Schätzer werden also mit wachsendem Stichprobenumfang immer genauer.
Effizienz: Ein effizienter Schätzer weist unter allen unverzerrten Schätzern für denselben Parameter die geringste Varianz auf. Dies bedeutet, dass er die kleinste Streuung um den wahren Parameterwert besitzt, also präzisere Schätzungen liefert.

Als nächstes werden wir geeignete Schätzfunktionen für den Erwartungswert und die Varianz untersuchen und jeweils deren Güte bewerten. Wie bereits erwähnt, gehen wir in hier davon aus, dass es sich bei der zu analysierenden Grundgesamtheit um eine Normalverteilung handelt.

Schätzung des Erwartungswerts und dessen Güte

Der Stichprobenmittelwert ist ein typisches Beispiel für eine Punktschätzung des Erwartungswerts. Durch die Anwendung der Maximum-Likelihood-Methode kann gezeigt werden, dass der Stichprobenmittelwert $\bar{y}$ einer Zufallsstichprobe als geeigneter Schätzwert $\hat{\mu}$ für den unbekannten Erwartungswert $\mu$ einer Wahrscheinlichkeitsverteilung betrachtet werden kann:

$\hat{\mu} = \bar{y} = \frac{1}{n} \sum_{i=1}^{n} y_i.$

Dieser Schätzwert stellt eine Realisierung der Schätzfunktion $\bar{Y}$ dar, definiert als:

$\bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i.$

Güte der Schätzung

Die Schätzfunktion $\bar{Y}$ weist die drei oben aufgeführten Eigenschaften auf:

Erwartungstreue: Da der Erwartungswert jeder Stichprobenvariable $\operatorname{E}(Y_i)=\mu$ beträgt, kann gezeigt werden (z.B. in Lange und Mosler, 2017), dass auch der Erwartungswert der Stichprobenfunktion diesem Wert entspricht:

$\operatorname{E}(\bar{Y}) = \mu.$

Der Schätzer ist also erwartungstreu.
Konsistenz: Wenn die Varianz der Grundgesamtheit, $\sigma^2$ , bekannt ist, beträgt auch die Varianz der Stichprobenvariablen $\operatorname{Var}(Y_i)=\sigma^2$ . Daher kann gezeigt werden (z.B. in Lange und Mosler, 2017), dass die Varianz des Stichprobenmittels

$\operatorname{Var}(\bar{Y}) = \frac{\sigma^2}{n}$

beträgt. Ist $\sigma^2$ hingegen nicht bekannt, wird dieser Wert mithilfe der Stichprobenvarianz $s^2$ aus den Stichprobendaten geschätzt. Da der Schätzer $\bar{Y}$ für jeden Stichprobenumfang erwartungstreu ist und seine Varianz mit steigendem Stichprobenumfang gegen Null konvergiert, ist der Schätzer konsistent.
Effizienz: Die Schätzfunktion $\bar{Y}$ ist effizient, da sie unter den erwartungstreuen Schätzfunktionen für den Mittelwert bei einem gegebenen Stichprobenumfang die geringste Varianz aufweist.

Schätzung der Varianz und deren Güte

Die empirische Varianz einer Stichprobe kann als Maß für die Streuung der Beobachtungswerte um ihren Mittelwert verwendet werden. Die Formel zur Berechnung dieser Varianz, hier mit $s_\text{emp}^2$ bezeichnet, lautet:

$s_\text{emp}^2 = \frac{1}{n} \sum_{i=1}^n (y_i - \bar{y})^2.$

Statt der empirischen Varianz wird in der Praxis jedoch oft die korrigierte empirische Varianz, hier mit $s^2$ bezeichnet, als Schätzwert $\hat{\sigma}^2$ für die Varianz $\sigma^2$ verwendet:

$\hat{\sigma}^2 = s^2 = \frac{1}{n-1} \sum_{i=1}^n (y_i - \bar{y})^2.$

Die zu $s^2$ zugehörige Schätzfunktion $S^2$ lautet:

$S^2 = \frac{1}{n-1} \sum_{i=1}^n (Y_i - \bar{Y})^2.$

Im Folgenden sprechen wir statt von der korrigierten empirischen Varianz jedoch nur von der Stichprobenvarianz. Es ist zu beachten, dass sowohl die Benennungen als auch die entsprechenden Notationen in der Literatur nicht einheitlich verwendet werden. Das heißt, es ist darauf zu achten, welche Konvention bzw. Definition im entsprechenden Kontext gilt.

Die korrigierte Form der Varianz berücksichtigt, dass der unbekannte Erwartungswert selbst aus den Daten geschätzt wurde. Deshalb verringert sich auch der Freiheitsgrad im Nenner von $n$ auf $n-1$ . Diese Form der Varianz führt im Unterschied zur ersten Form zu einem erwartungstreuen Schätzer.

Für die Schätzung der Standardabweichung $\sigma$ der Grundgesamtheit wird die Quadratwurzel der Schätzfunktion der Stichprobenvarianz, also $S = \sqrt{S^2}$ , verwendet. Diese Funktion ist jedoch nicht erwartungstreu, sondern neigt zu einer leichten Unterschätzung des wahren Wertes.

Güte der Schätzung

Die Güte des Schätzers $S^2$ wird wieder anhand der folgenden Kriterien beurteilt:

Erwartungstreue: Der Erwartungswert des Schätzers beträgt (Lange und Mosler, 2017):

$\operatorname{E}(S^2) = \sigma^2.$

Das heißt, der Schätzer ist erwartungstreu.
Konsistenz: Die Varianz des Schätzers ist durch folgende Formel gegeben (Timischl 2016):

$\operatorname{Var}(S^2) = \frac{2\sigma^4}{n-1}.$

Das heißt, die Varianz nimmt mit wachsendem Stichprobenumfang ab, sodass es sich bei $S^2$ um einen konsistenten Schätzer handelt.
Effizienz: Da der Schätzer unter der Bedingung einer normalverteilten Grundgesamtheit und bei gegebenem Stichprobenumfang $n$ die geringstmögliche Varianz unter allen unverzerrten Schätzern aufweist, handelt es sich um einen effizienten Schätzer (Bankhofer und Vogel, 2008).

Grenzen von Punktschätzungen

Eine Schätzfunktion, die den oben genannten Qualitätskriterien entspricht, wird bei ausreichend großem Stichprobenumfang im Durchschnitt korrekte Punktschätzungen liefern. Jedoch erreicht eine Punktschätzung den wahren Parameterwert in der Regel nur zufällig exakt und kann weder die Zuverlässigkeit des Schätzwertes noch die Größe des Schätzfehlers quantifizieren.

Im Gegensatz dazu bezieht die nachfolgend behandelte Intervallschätzung ein Konfidenz- oder Vertrauensniveau mit in die Schätzung ein. Dadurch kann die Unsicherheit des Schätzwertes explizit bewertet werden.

Intervallschätzung

Die Intervallschätzung erweitert das Konzept der Punktschätzung, indem sie nicht nur einen einzelnen Schätzwert $\hat{\vartheta}$ für einen unbekannten Parameter $\vartheta$ liefert, sondern ein Schätzintervall.

Ein Intervall $[\Theta_\text{u}, \Theta_\text{o}]$ wird als zweiseitiges Konfidenzintervall zum Konfidenzniveau $\gamma$ bezeichnet, wenn die Bedingung

$\operatorname{P}(\Theta_\text{u} < \vartheta < \Theta_\text{o}) = \gamma$

erfüllt wird. Hierbei ist $\gamma$ das Konfidenzniveau, auch bekannt als Konfidenzwahrscheinlichkeit oder Überdeckungswahrscheinlichkeit. Dies bedeutet, dass der wahre Wert des Parameters $\vartheta$ vom Konfidenzintervall mit dieser vorgegebenen Wahrscheinlichkeit überdeckt wird.

Da die Grenzen des Intervalls Stichprobenfunktionen, also Zufallsvariablen, sind, wird auch das Konfidenzintervall zu einem ‘Zufallsintervall’. Erst durch konkrete Stichprobenwerte können Realisierungen der Zufallsvariablen bestimmt werden, die die Intervallgrenzen $\vartheta_\text{u}$ und $\vartheta_\text{o}$ des Schätzintervalls, also der Konfidenzintervall-Schätzung, bilden.

Das Konfidenzniveau $\gamma$ , üblicherweise festgelegt auf 90%, 95% oder 99%, spiegelt das Vertrauen in die Schätzung wider. Der Komplementärwert $\alpha = 1 - \gamma$ repräsentiert die Irrtumswahrscheinlichkeit, d.h., die Wahrscheinlichkeit, dass das Intervall den wahren Parameterwert nicht überdeckt.

Die spezifische Wahl der Stichprobenfunktionen $\Theta_\text{u}$ und $\Theta_\text{o}$ sowie deren Berechnung für Parameter wie den Erwartungswert und die Varianz werden in den folgenden Abschnitten erläutert. Dabei wird auch der Begriff ‘Überdeckung des wahren Parameters’ veranschaulicht.

Stichprobe generieren

Das Beispiel beginnt mit der Ziehung einer Stichprobe aus einer Grundgesamtheit, wobei wieder ein Merkmal $Y$ untersucht werden soll. Die Grundgesamtheit sei standardnormalverteilt (Erwartungswert $\mu=0$ und Standardabweichung $\sigma=1$ ).

Die folgende Abbildung zeigt die zugehörige Wahrscheinlichkeitsverteilung dieser Grundgesamtheit. Mittels einer Schaltfläche kann eine Stichprobe erzeugt werden, deren Umfang $n$ über einen Schieberegler variiert werden kann. Der Maximalwert von $n$ wird hier nur aus Gründen der Darstellbarkeit begrenzt.

Stichprobenumfang n

Nach der Ziehung einer Stichprobe wird die Häufigkeitsverteilung der Stichprobe in der Abbildung als Dot-Plot-Histogramm dargestellt. In dieser Darstellungsform entspricht jeder Punkt einem einzelnen Datenpunkt aus der Stichprobe. Bei dieser Darstellungsform muss beachtet werden, dass die Datenpunkte in Klassen (englisch bins) eingeteilt werden, um eine vertikale Stapelung zu ermöglichen. Dadurch kann jedoch der Anschein erweckt werden, als würden Datenpunkte mit unterschiedlichen Stichprobenwerten die gleichen Werte aufweisen.

Zusätzlich wird in der Abbildung der Stichprobenmittelwert $\bar{y}$ , die Stichprobenvarianz $s^2$ und die Stichprobenstandardabweichung $s$ angezeigt. Diese Werte werden nach den zuvor angegebenen Formeln berechnet und sind Punktschätzer für den Erwartungswert $\mu$ , die Varianz $\sigma^2$ und die Standardabweichung $\sigma$ . Diese Schätzwerte sind Realisierungen der zuvor definierten Schätzfunktionen $\bar{Y}$ , $S^2$ und $S$ . Da diese Schätzfunktionen von den Zufallsvariablen $Y_i$ abhängen, sind auch $\bar{Y}$ , $S^2$ und $S$ Zufallsvariablen mit berechenbaren Stichprobenverteilungen. Diese Stichprobenverteilungen werden in den nächsten Abschnitten für die Berechnung der Schätzintervalle verwendet.

Schätzintervall für den Erwartungswert

Die Verteilung von $\bar{Y}$ , d. h. die Stichprobenverteilung des Stichprobenmittelwerts, wird als Grundlage zur Berechnung des Schätzintervalls verwendet.

Zunächst betrachten wir den Fall, dass die Standardabweichung der Grundgesamtheit zum Zeitpunkt der Stichprobenziehung bekannt ist. Unter dieser Annahme folgt $Y$ einer Normalverteilung mit den Parametern $\mu$ und $\sigma$ . Daraus ergibt sich, dass $\bar{Y}$ ebenfalls einer Normalverteilung folgt. Der Erwartungswert $\mu_{\bar{y}}$ dieser Verteilung entspricht dem Stichprobenmittelwert, also $\mu_{\bar{y}} = \bar{y}$ . Die Standardabweichung dieser Verteilung, mit $\sigma_{\bar{y}}$ bezeichnet, beträgt $\sigma/\sqrt{n}$ , also dem Standardfehler des Mittelwerts.

Für den Fall, dass die Standardabweichung der Grundgesamtheit nicht bekannt ist, wird diese durch die Stichprobenstandardabweichung geschätzt. In diesem Fall ist die Stichprobenverteilung nicht mehr normalverteilt, sondern t-verteilt.

In der folgenden Abbildung ist die Stichprobenverteilung dargestellt. Über das Dropdown-Menü kann ausgewählt werden, ob die Standardabweichung der Grundgesamtheit bekannt sein soll oder nicht. Ist sie nicht bekannt und der Stichprobenumfang relativ klein, ist der Unterschied zwischen den beiden Verteilungen gut zu erkennen, da die Verteilungsdichte bei der t-Verteilung breiter ist als bei der Normalverteilung.

Standardabweichung der Grundgesamtheit bekannt?

Konfidenzniveau γ

Der Maßstab der horizontalen Achse in der obigen Abbildung kann durch Anklicken und Ziehen variiert werden und durch Doppelklicken zurückgesetzt werden. Der ursprüngliche Maßstab entspricht dem Maßstab der vorherigen Abbildung. Dadurch wird der Einfluss des Stichprobenumfangs auf die Stichprobenverteilung deutlich. Hat man zum Beispiel einen besonders kleinen Stichprobenumfang gewählt, wird der Standardfehler des Mittelwerts und damit die Streuung dieser Verteilung besonders groß.

Darüber hinaus kann über das Dropdown-Menü ein Konfidenzniveau $\gamma$ ausgewählt werden. Ausgehend von diesem Konfidenzniveau wird ein um den Punktschätzwert $\bar{y}$ symmetrisches Schätzintervall $[\bar{y}_\text{u},~\bar{y}_\text{o}]$ bestimmt. Dieses Intervall wird so konstruiert, dass der Flächeninhalt unter der Kurve – begrenzt durch das Schätzintervall – dem Konfidenzniveau entspricht. Der komplementäre Bereich zu dieser Fläche entspricht der Irrtumswahrscheinlichkeit $\alpha$ .

Typische Werte bei der Auswahl des Konfidenzniveaus sind 90%, 95% und 99%. Die Wahl des Konfidenzniveaus hängt von der gewünschten Genauigkeit und der spezifischen Problemstellung ab.

In der obigen Abbildung verändert sich die Farbe der Fläche unter der Verteilungskurve, je nachdem, ob das Schätzintervall den wahren Erwartungswert der Grundgesamtheit (hier $\mu=0$ ) überdeckt oder nicht. Grün zeigt an, dass der wahre Wert überdeckt wird, während Rot anzeigt, dass er nicht überdeckt wird.

Wenn die Stichprobenziehung sehr oft wiederholt wird, ist zu erwarten, dass die ermittelten Schätzintervalle in $\gamma \cdot 100\%$ aller Fälle den unbekannten Parameter enthalten (überdecken), also ein “grünes Intervall” auftritt. Demnach wird in $\alpha \cdot 100\%$ der Fälle ein “rotes Intervall” auftreten.

Mithilfe der folgenden Animation wird dieser Zusammenhang veranschaulicht. Über die Schaltflächen können Wiederholungen von Stichprobenziehungen ausgeführt werden. Für jede Stichprobenziehung wird das berechnete Schätzintervall im Diagramm angezeigt. Die Farbe des Intervalls gibt wieder an, ob der wahre Wert überdeckt wird oder nicht. Außerdem ist der Anteil $r$ zwischen Überdeckung und Nicht-Überdeckung in der Abbildung angegeben.

Stichprobenziehungen (Wiederholungen)

Mit zunehmender Anzahl an Wiederholungen strebt der Wert $r$ gegen das zuvor festgelegte Konfidenzniveau $\gamma$ . Das heißt, wenn die Berechnung für viele Stichproben aus derselben Grundgesamtheit wiederholt wird, wird sich in $\gamma \cdot 100\%$ der Fälle ein Schätzintervall ergeben, das den wahren Wert des betrachteten Parameters überdeckt.

Standardisierte Zufallsvariablen

Nach der oben beschriebenen Vorgehensweise lassen sich konkrete Werte für die untere und obere Grenze des Schätzintervalls für den Erwartungswert berechnen. Bei manueller Bestimmung von Schätzintervallen oder bei der Intervallschätzung für die Varianz erfolgt die Berechnung jedoch auf Basis von standardisierten Zufallsvariablen und standardisierten Verteilungen. Bei der manuellen Durchführung kann man dadurch auch auf tabellierte Werte von Wahrscheinlichkeitsverteilungen zurückgreifen.

Durch Standardisierung wird für den ersten Fall (bekannte Varianz) aus der normalverteilten Zufallsvariable $\bar{Y}$ die standardnormalverteilte Zufallsvariable $Z$ . Die Standardisierung erfolgt über die z-Transformation, also:

$Z = \frac{\bar{Y} - \mu}{\sigma / \sqrt{n}} \sim \operatorname{N}(0,1).$

Für den zweiten Fall (unbekannte Varianz) wird aus der Zufallsvariable $\bar{Y}$ die t-verteilte Zufallsvariable $T$ mit $n-1$ Freiheitsgraden, bei der statt der Standardabweichung $\sigma$ die aus der Stichprobe geschätzte Standardabweichung $s$ verwendet wird:

$T = \frac{\bar{Y} - \mu}{s / \sqrt{n}} \sim \operatorname{t}(n-1).$

In beiden Fällen wird das um Null symmetrische Vertrauensintervall $[z_\text{u}, z_\text{o}]$ bzw. $[t_\text{u}, t_\text{o}]$ anhand der folgenden Bedingungen bestimmt:

$\begin{align} \operatorname{P}(z_\text{u} \leq Z \leq z_\text{o}) &= \gamma \\ \operatorname{P}(t_\text{u} \leq T \leq t_\text{o}) &= \gamma \end{align}$

Die nachfolgende Abbildung zeigt die Wahrscheinlichkeitsdichte und die um Null symmetrische Fläche unter dieser Kurve, die einen Flächeninhalt entsprechend des Konfidenzniveaus einnimmt. Der linke und rechte Teil unter der Kurve, außerhalb des Schätzintervalls, besitzt jeweils einen Flächeninhalt von $\alpha/2$ .

Standardabweichung der Grundgesamtheit bekannt?

Konfidenzniveau γ

Mit diesem Wissen über die Aufteilung der Flächeninhalte lassen sich die Grenzen des Intervalls bestimmen. Wir suchen zum einen den Wert von $z_\text{u}$ (bzw. $t_\text{u}$ ), sodass der unter der Kurve liegende Flächeninhalt von $-\infty$ bis zu diesem Wert dem Wert $\alpha/2$ entspricht. Darüber hinaus suchen wir den Wert von $z_\text{o}$ (bzw. $t_\text{o}$ ), sodass der unter der Kurve liegende Flächeninhalt von $-\infty$ bis zu diesem Wert dem Wert $\alpha/2 + \gamma = 1 - \alpha/2$ entspricht. Diese Werte können wir entweder mithilfe von Statistiksoftware oder unter Verwendung von tabellierten Werten der jeweiligen Wahrscheinlichkeitsverteilung ermitteln.

Durch die Nutzung einer Software können diese Werte mithilfe der Quantilsfunktion für die entsprechende Wahrscheinlichkeitsverteilung berechnet werden. Die Quantilsfunktion ist die inverse Funktion der Verteilungsfunktion. Sie gibt für einen gegebenen Wahrscheinlichkeitswert $p$ (also Flächeninhalt unter der Dichtekurve) den zugehörigen Wert $z$ (bzw. $t$ ) zurück. Also bei gegebenen Flächeninhalt, gibt diese Funktion die Grenze an, die diese Fläche bestimmt.

Alternativ werden diese Werte mithilfe von Tabellenwerten (z.B. bei Papula, 2017) für gegebene Quantile (z.B. 0.90, 0.95, 0.975, 0.99) bestimmt. Durch Symmetrieeigenschaften können auch die Werte für die Gegenquantile bestimmt werden.

In der nachfolgenden Tabelle sind typische Wertepaare von Wahrscheinlichkeiten und zugehörige Quantile für die Standardnormalverteilung aufgeführt:

$p$	$z$
0.90	1.282
0.95	1.645
0.975	1.960
0.99	2.326

Bei der Benutzung einer t-Verteilung ist sowohl bei der Auswertung der Quantilsfunktion mithilfe einer Statistiksoftware als auch bei der Benutzung einer Tabelle noch der zugrundeliegende Freiheitsgrad zu berücksichtigen. Die Verwendung unterscheidet sich im Prinzip aber nicht.

Anhand der Definition von $Z$ und $T$ sowie den zuvor aufgestellten Bedingungen $\operatorname{P}(z_\text{u} \leq Z \leq z_\text{o}) = \gamma$ bzw. $\operatorname{P}(t_\text{u} \leq T \leq t_\text{o}) = \gamma$ können Ungleichungen für den unbekannten Mittelwert formuliert werden, die die Bestimmungsgleichungen für die untere und obere Grenzen für die Konfidenzintervalle beinhalten:

$\begin{array}{rrlcll} &z_\text{u} & \leq & Z & \leq & z_\text{o}\\ \Leftrightarrow & z_\text{u} &\leq& \frac{ \bar{Y} - \mu}{\sigma / \sqrt{n}} & \leq& z_\text{o}\\ \Leftrightarrow & \bar{Y} + z_\text{u} \frac{\sigma}{\sqrt{n}} &\leq& \mu &\leq & \bar{Y} + z_\text{o} \frac{\sigma}{\sqrt{n}} \end{array}$

Für den zweiten Fall unter Verwendung der t-Verteilung erfolgt die Vorgehensweise analog.

Auf diese Weise können die folgenden Formeln für die Grenzen der Schätzintervalle bestimmt werden, wobei wir für die Schätzfunktion $\bar{Y}$ den aus der Stichprobe ermittelten Schätzwert $\bar{y}$ verwenden:

$\begin{align*} \bar{y}_\text{u} &= \bar{y} + z_\text{u} \frac{\sigma}{\sqrt{n}} \qquad \text{und} \\ \bar{y}_\text{o} &= \bar{y} + z_\text{o} \frac{\sigma}{\sqrt{n}} \qquad \text{bzw.} \\ &\\ \bar{y}_\text{u} &= \bar{y} + t_\text{u} \frac{s}{\sqrt{n}} \qquad \text{und} \\ \bar{y}_\text{o} &= \bar{y} + t_\text{o} \frac{s}{\sqrt{n}}. \end{align*}$

Da $z_\text{u} = -z_\text{o}$ bzw. $t_\text{u} = -t_\text{o}$ erkennt man, dass es sich um ein um $\bar{y}$ symmetrisches Intervall handelt.

Schätzintervall für die Varianz

Ähnlich wie für den Erwartungswert kann auch für die Varianz einer normalverteilten Grundgesamtheit ein Schätzintervall bestimmt werden. Wir gehen von einer Grundgesamtheit mit einem (bekannten oder unbekannten) Erwartungswert $\mu$ und einer unbekannten Varianz $\sigma^2$ aus. Aus einer konkreten Zufallsstichprobe soll ein Schätzintervall für diese Varianz bestimmt werden. Als Schätzfunktion verwenden wir die zuvor definierte Stichprobenfunktion für die korrigierte empirische Varianz. Auf deren Grundlage lässt sich eine Zufallsvariable (Stichprobenfunktion) $Q$ bilden, die einer Chi-Quadrat-Verteilung mit $\nu = n - 1$ Freiheitsgraden folgt:

$Q = (n - 1) \frac{S^2}{\sigma^2} \sim \chi^2(n-1).$

Nach Festlegung eines bestimmten Konfidenzniveaus $\gamma$ können die Grenzen $q_\text{u}$ und $q_\text{o}$ so bestimmt werden, dass die Zufallsvariable mit der Wahrscheinlichkeit $\gamma$ Werte innerhalb dieser Grenzen annimmt. Die Berechnung der Intervallgrenzen erfolgt nach der Bedingung

$\operatorname{P}(q_\text{u} \leq Q \leq q_\text{o}) = \gamma = 1 - \alpha.$

Der Flächenanteil der Irrtumswahrscheinlichkeit $\alpha$ wird dabei gleichmäßig auf beide Seiten der Dichtefunktion verteilt. Die folgende Abbildung zeigt die Dichtefunktion der Chi-Quadrat-Verteilung mit zur Stichprobe passenden Freiheitsgraden. Darüber hinaus ist der Flächeninhalt passend zum Konfidenzniveau sowie die untere und obere Grenze des Schätzintervalls angegeben.

Konfidenzniveau γ

Die Berechnung der Werte für $q_\text{u}$ und $q_\text{o}$ erfolgt wieder wie oben beschrieben mithilfe von Statistiksoftware und der Quantilsfunktion oder mit tabellierten Werten der Chi-Quadrat-Verteilung.

Aus der oben genannten Bedingung und folgenden Umformungen können die untere und obere Grenze für das Schätzintervall der Varianz bestimmt werden, wobei für die Schätzfunktion $S^2$ der ermittelte Schätzwert $s^2$ verwendet wird:

$\begin{array}{rrlcll} & q_\text{u} &\leq& Q & \leq& q_\text{o}\\ \Leftrightarrow & q_\text{u} &\leq& (n - 1) \frac{S^2}{\sigma^2} & \leq& q_\text{o}\\ \Leftrightarrow & (n - 1) \frac{S^2}{q_\text{o}} &\leq& \sigma^2 & \leq& (n - 1) \frac{S^2}{q_\text{u}}. \end{array}$

Manuelle Durchführung

Um das Verständnis für die hier vorgestellte Methode zu vertiefen, erfolgt zunächst eine manuelle Durchführung eines Anwendungsbeispiels, gefolgt von der Durchführung mit R und SPSS.

Für Demonstrationszwecke wird der mice-Datensatz aus dem R-Paket datarium verwendet. Dieses Paket beinhaltet eine Vielzahl von Datensätzen, die häufig zur Veranschaulichung statistischer Methoden genutzt werden. Die nachfolgende Datentabelle enthält die Messwerte dieses Datensatzes.

Datentabelle (ein-/ausblenden)

Der verwendete Datensatz enthält zehn Zeilen und zwei Spalten, wobei die erste Spalte einen Bezeichner und die zweite das Gewicht von Mäusen in Gramm enthält. Diese Gewichtsmessungen entsprechen den beobachteten Merkmalswerten $y_1, y_2, \dots, y_n$ .

Anhand dieses Datensatzes sollen zuerst Punktschätzungen und anschließend Intervallschätzungen für den Erwartungswert und die Varianz der zugrundeliegenden Grundgesamtheit bestimmt werden. Das Konfidenzniveau soll $\gamma=0.95$ betragen.

Der Stichprobenumfang $n$ entspricht der Anzahl an Messwerten: $n = 10~.$

Aus den Daten lassen sich der Stichprobenmittelwert $\bar{y}$ , die Stichprobenvarianz $s^2$ und die Stichprobenstandardabweichung $s$ bestimmen. Dabei handelt es sich um Punktschätzwerte für den jeweiligen Parameter. Die hier gezeigten Zahlenwerte werden mit maximal vier signifikanten Stellen und ohne Einheiten angegeben:

$\begin{align*} \bar{y} &= \frac{1}{n} \sum_{i=1}^{n}y_i \\ &= 20.14~,\\ &\\ s^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (y_i - \bar{y})^2~ \\ &= 3.596~, \\ &\\ s &= \sqrt{s^2} \\ &= 1.896~. \end{align*}$

Als nächstes bestimmen wir die Grenzen der Konfidenzintervalle, zuerst für den Mittelwert, dann für die Varianz. Da die Varianz der Grundgesamtheit unbekannt ist, basiert die Intervallschätzung auf der t-Verteilung. Die Anzahl der Freiheitsgrade, $\nu$ , beträgt $\begin{align*} \nu&=n-1\\ &=9~. \end{align*}$

Mithilfe einer Tabelle lassen sich die Werte $t_\text{u}$ und $t_\text{o}$ zu den Quantilen $\alpha/2$ und $1-\alpha/2$ bestimmen. Tatsächlich muss nur der Wert des zweiten Quantils bestimmt werden, da sich der andere Wert aus Gründen der Symmetrie ergibt.

Die nachfolgende Tabelle (z.B. Papula, 2017) enthält für spezielle Wahrscheinlichkeitswerte $p$ das jeweils zugehörige Quantil der t-Verteilung bei $\nu$ Freiheitsgraden.

	p
ν	0.9	0.95	0.975	0.99	0.995
1	3.078	6.314	12.71	31.82	63.66
2	1.886	2.92	4.303	6.965	9.925
3	1.638	2.353	3.182	4.541	5.841
4	1.533	2.132	2.776	3.747	4.604
5	1.476	2.015	2.571	3.365	4.032
6	1.44	1.943	2.447	3.143	3.707
7	1.415	1.895	2.365	2.998	3.499
8	1.397	1.86	2.306	2.896	3.355
9	1.383	1.833	2.262	2.821	3.25
10	1.372	1.812	2.228	2.764	3.169

Aus der Tabelle lassen sich für die Wahrscheinlichkeit $p=0.975$ der Wert $t_\text{o}=2.262$ ablesen. Damit ergibt sich wegen der Symmetrie der Wert $t_\text{u}$ zu $t_\text{u}=-2.262$ .

Die Grenzen des Schätzintervalls lassen sich somit wie folgt berechnen:

$\begin{align*} \bar{y}_\text{u} &= \bar{y} + t_\text{u} \frac{s}{\sqrt{n}}\\ &= 20.14 + (-2.262) ~\frac{ 1.896 }{\sqrt{ 10 }} \\ &= 18.78\\ & \\ \bar{y}_\text{o} &= \bar{y} + t_\text{o} \frac{s}{\sqrt{n}} \\ &= 20.14 + (2.262) ~\frac{ 1.896 }{\sqrt{ 10 }} \\ &= 21.5\\ \end{align*}$

Zur Bestimmung der Intervallgrenzen für die Varianz können die Werte $q_\text{u}$ und $q_\text{o}$ in ähnlicher Weise mithilfe tabellierter Werte für die Chi-Quadrat-Verteilung bestimmt werden.

Die nachfolgende Tabelle (z.B. Papula, 2017) enthält für spezielle Wahrscheinlichkeitswerte $p$ das jeweils zugehörige Quantil der Chi-Quadrat-Verteilung bei $\nu$ Freiheitsgraden.

	p
ν	0.005	0.01	0.025	0.05	0.1	0.9	0.95	0.975	0.99	0.995
1	0	0	0.001	0.004	0.016	2.706	3.841	5.024	6.635	7.879
2	0.01	0.02	0.051	0.103	0.211	4.605	5.991	7.378	9.21	10.6
3	0.072	0.115	0.216	0.352	0.584	6.251	7.815	9.348	11.34	12.84
4	0.207	0.297	0.484	0.711	1.064	7.779	9.488	11.14	13.28	14.86
5	0.412	0.554	0.831	1.145	1.61	9.236	11.07	12.83	15.09	16.75
6	0.676	0.872	1.237	1.635	2.204	10.64	12.59	14.45	16.81	18.55
7	0.989	1.239	1.69	2.167	2.833	12.02	14.07	16.01	18.48	20.28
8	1.344	1.646	2.18	2.733	3.49	13.36	15.51	17.53	20.09	21.95
9	1.735	2.088	2.7	3.325	4.168	14.68	16.92	19.02	21.67	23.59
10	2.156	2.558	3.247	3.94	4.865	15.99	18.31	20.48	23.21	25.19

Damit lassen sich die Werte $q_\text{u}=2.7$ und $q_\text{o}=19.02$ ablesen, und die Grenzen des Schätzintervalls wie folgt bestimmen:

$\begin{align*} s^2_\text{u} &= (n-1) ~\frac{s^2}{q_\text{o}}\\ &= (10-1) ~\frac{ 3.596 }{19.02}\\ &= 1.701\\ & \\ s^2_\text{o} &= (n-1) ~\frac{s^2}{q_\text{u}}\\ &= (10-1) ~\frac{ 3.596 }{2.7}\\ &= 11.98~. \end{align*}$

Durchführung in R

Sowohl die Punkt- als auch die Intervallschätzungen werden in R mithilfe interner Funktionen berechnet, ohne dass zusätzliche Pakete geladen werden müssen.

Daten importieren

Hier wird der Datensatz mice aus dem Paket datarium verwendet. Da das Paket nicht standardmäßig installiert ist, muss es bei lokaler Ausführung gegebenenfalls über install.packages() installiert werden (hier jedoch nicht erforderlich). Über den Befehl library() und der Angabe des Namens des Paketes wird das Paket geladen. Durch die Angabe des Namens des Datensatzes wird dieser ausgegeben.

# install.packages("datarium")
library("datarium")
mice

Punktschätzung für den Erwartungswert und die Varianz

Zuerst definieren wir folgende Variablen mit festen Werten, Konfidenzniveau gamma, Irrtumswahrscheinlichkeit alpha und Freiheitsgrad nu:

gamma <- 0.95 
alpha <- 1 - gamma

Aus den Stichprobendaten kann der Stichprobenumfang sample_size und der Freiheitsgrad degrees_of_freedom berechnet werden:

sample_size <- length(mice$weight)
degrees_of_freedom <- sample_size - 1

Der Mittelwert mean_value wird über die Funktion mean() berechnet, die Varianz variance über die Funktion var(). Dies sind die Punktschätzungen für die gesuchten Parameter:

mean_value <- mean(mice$weight)
variance <- var(mice$weight)

Intervallschätzung für den Erwartungswert

Danach werden der Standardfehler für den Mittelwert, das Quantil der t-Verteilung für die gegebene Wahrscheinlichkeit und der Freiheitsgrad berechnet:

standard_deviation <- sd(mice$weight)
standard_error <- standard_deviation / sqrt(n)
t_score <- qt(p = 1-alpha/2, df = degrees_of_freedom) 
margin_error <- t_score * standard_error

Damit lassen sich die untere und obere Grenze berechnen und ausgeben:

lower_bound_mean <- mean_value - margin_error
upper_bound_mean <- mean_value + margin_error

# Ausgabe
lower_bound_mean
upper_bound_mean

Intervallschätzung für die Varianz

Für die Intervallschätzung der Varianz werden zuerst die Werte zu den Quantilen $\alpha/2$ und $1-\alpha/2$ mithilfe der Quantilsfunktion der Chi-Quadrat-Verteilung bestimmt:

chi2_lower <- qchisq(p = alpha/2, df= degrees_of_freedom)
chi2_upper <- qchisq(p = 1 - alpha/2, df= degrees_of_freedom)

Abschließend können die untere und obere Grenze berechnet werden:

lower_bound_variance <- (n-1) * variance / chi2_upper 
upper_bound_variance <- (n-1) * variance / chi2_lower 

lower_bound_variance 
upper_bound_variance

Durchführung in SPSS

In SPSS können die meisten Berechnungen über die graphische Benutzeroberfläche durchgeführt werden. Lediglich für die Berechnung des Konfidenzintervalls der Varianz ist die Ausführung von Syntax-Code notwendig.

Daten importieren

Wie zuvor wird auch hier der Datensatz mice aus dem Paket datarium verwendet. Die Daten können aus der nachfolgenden Datentabelle via Copy/Paste in den SPSS-Dateneditor in der Datenansicht eingefügt werden. Nach dem Einfügen der Spaltennamen muss die erste Zeile im Dateneditor manuell gelöscht werden.

Datentabelle (ein-/ausblenden)

Variablen benennen

Für eine bessere Nachvollziehbarkeit können die Spalten in der Variablenansicht umbenannt werden. In jedem Fall müssen der Typ, die Dezimalstellen und das Maß korrekt angegeben werden.

Punkt- und Intervallschätzwert für den Mittelwert

Die Berechnung erfolgt über die Menüabfolge Analysieren > Deskriptive Statistiken > Explorative Datenanalyse….

Als Abhängige Variable wird weight ausgewählt. Unter Statistiken… sollte die Option Deskriptive Statistik aktiviert und das Konfidenzintervall für den Mittelwert auf 95% eingestellt sein.

In der Ausgabe erscheinen der Mittelwert und das 95% Konfidenzintervall für den Mittelwert.

Punkt- und Intervallschätzwert für die Varianz

Die Berechnung startet über Analysieren > Deskriptive Statistiken > Deskriptive Statistik….

Als Variable(n) wird weight ausgewählt und unter Optionen… die Varianz aktiviert.

In der Ausgabe werden die Werte für den Stichprobenumfang und die Varianz angezeigt.

Schätzintervall der Varianz

Das zugehörige Schätzintervall wird mithilfe von Syntax-Code berechnet. Ein neues Eingabefenster für Syntax-Code wird über Datei > Neue Syntax geöffnet.

Der folgende Code kann in den Syntax-Editor eingefügt werden. Hier sind die Werte für den Stichprobenumfang, die Freiheitsgrade, das Signifikanzniveau und die Varianz bereits angepasst:

COMPUTE N = 10.
COMPUTE df = N - 1.
COMPUTE alpha = 0.05.
COMPUTE Varianz = 3.596.

COMPUTE Chi2_Lower = IDF.CHISQ(alpha/2, df).
COMPUTE Chi2_Upper = IDF.CHISQ(1-alpha/2, df).

COMPUTE Var_Lower = (df * Varianz) / Chi2_Upper.
COMPUTE Var_Upper = (df * Varianz) / Chi2_Lower.

EXECUTE.

Die Befehle werden ausgeführt, indem sie zunächst vollständig markiert (Strg + A) und dann mit Strg + R ausgeführt werden.

Das berechnete Schätzintervall wird in den neu erzeugten Spalten angezeigt.

Wie erwartet, stimmen die Werte mit den manuell und mit R berechneten Werten überein.

Literaturverzeichnis

Bankhofer, U., Vogel, J. (2008). Datenanalyse und Statistik: Eine Einführung für Ökonomen im Bachelor. Gabler.

Dietmaier, C. (2014). Mathematik für angewandte Wissenschaften. Springer Spektrum.

Lange, T., Mosler, K. (2017). Statistik kompakt: Basiswissen für Ökonomen und Ingenieure. Springer Gabler

Papula, L. (2016). Mathematik für Ingenieure und Naturwissenschaftler - Band 3 - Vektoranalysis, Wahrscheinlichkeitsrechnung, Mathematische Statistik, Fehler- und Ausgleichsrechnung (7. Auflage). Springer Vieweg.

Papula, L. (2017). Mathematische Formelsammlung: Für Ingenieure und Naturwissenschaftler (12. Auflage). Springer Vieweg.

Timischl, W. (2016). Mathematische Methoden in den Biowissenschaften: Eine Einführung mit R (3. Auflage). Springer Spektrum.

Einleitung

Punktschätzung

Gewinnung von Schätzfunktionen

Güte von Schätzfunktionen

Schätzung des Erwartungswerts und dessen Güte

Güte der Schätzung

Schätzung der Varianz und deren Güte

Güte der Schätzung

Grenzen von Punktschätzungen

Intervallschätzung

Stichprobe generieren

Schätzintervall für den Erwartungswert

Standardisierte Zufallsvariablen

Schätzintervall für die Varianz

Manuelle Durchführung

Datentabelle (ein-/ausblenden)

Durchführung in R

Daten importieren

Punktschätzung für den Erwartungswert und die Varianz

Intervallschätzung für den Erwartungswert

Intervallschätzung für die Varianz

Durchführung in SPSS

Daten importieren

Datentabelle (ein-/ausblenden)

Variablen benennen

Punkt- und Intervallschätzwert für den Mittelwert

Punkt- und Intervallschätzwert für die Varianz

Schätzintervall der Varianz

Literaturverzeichnis

Schätztheorie

Bernhard Poethke