Skip to Tutorial Content

Einleitung

Die Schätztheorie ist ein zentraler Bereich der schließenden Statistik, der sowohl in theoretischen als auch in angewandten Kontexten eine große Bedeutung zukommt. Die Methoden der Schätztheorie zielen darauf ab, unbekannte Parameter von Wahrscheinlichkeitsverteilungen basierend auf Stichprobendaten zu schätzen und ermöglichen dadurch Rückschlüsse auf die gesamte Population. Diese Techniken bilden zudem die Grundlage für die Durchführung von Hypothesentests, die in nachfolgenden Kapiteln ausführlich behandelt werden.

Schätzverfahren lassen sich typischerweise in zwei Hauptkategorien einteilen: die Punktschätzung und die Intervallschätzung. Die Punktschätzung zielt darauf ab, einen einzelnen Schätzwert als Näherung für einen unbekannten Parameter zu bestimmen. Beispiele hierfür sind der Stichprobenmittelwert oder die Stichprobenvarianz, die jeweils als Schätzungen für den Erwartungswert bzw. die Varianz der Grundgesamtheit dienen.

Im Gegensatz dazu liefert die Intervallschätzung einen Wertebereich, der den wahren Parameter mit einer vorgegebenen Sicherheit überdeckt. Diese Schätzintervalle berücksichtigen die inhärente Unsicherheit in einer Schätzung.

Ein Praxisbeispiel für die Anwendung von Punkt- und Intervallschätzungen findet sich unter anderem in der medizinischen Forschung. Beispielsweise kann in einer Studie der Blutdruck von Personen gemessen werden, um den durchschnittlichen (systolischen) Blutdruck in einer Population zu schätzen. Dazu wird in einer Stichprobe von 100 Personen der Mittelwert des Blutdrucks berechnet. Dieser Stichprobenmittelwert dient als Punktschätzung für den unbekannten wahren Mittelwert des Blutdrucks in der gesamten Population. Darüber hinaus könnte ein 95%-Konfidenzintervall berechnet werden. Dieses Intervall gibt einen Bereich an, der den wahren Mittelwert mit einer Wahrscheinlichkeit von 95% überdeckt. Durch diese Berechnungen kann nicht nur eine Schätzung des Blutdrucks angegeben, sondern auch die Unsicherheit dieser Schätzung quantifiziert werden.

In diesem Kapitel werden zunächst die Konzepte der Punktschätzung und anschließend die der Intervallschätzung behandelt. Beide Verfahren werden exemplarisch für die Schätzung des Erwartungswerts und der Varianz einer Normalverteilung erläutert.

Das Ziel dieses Kapitels ist es, ein grundlegendes Verständnis für Parameterschätzungen zu vermitteln, welches auch auf die Schätzung weiterer Parameter wie den Median, den Modus oder Proportionen übertragen werden kann. Weitere Informationen zu diesen Parameterschätzungen finden sich in den Lehrbüchern von Papula (2016), Lange und Mosler (2017), Dietmaier (2014) und Bankhofer und Vogel (2008), auf die sich auch der Inhalt dieses Kapitels stützt.

Nach den theoretischen Erläuterungen folgt ein praktisches Beispiel, das die Anwendung der Schätztheorie unter Verwendung der statistischen Softwaretools R und SPSS demonstriert.

Punktschätzung

Die Punktschätzung zielt darauf ab, einen einzelnen, optimalen Schätzwert für einen unbekannten statistischen Parameter ϑ\vartheta einer Grundgesamtheit zu ermitteln. Dieser Parameter könnte beispielsweise der Erwartungswert μ\mu oder die Varianz σ2\sigma^2 sein. Die Basis für solche Schätzungen bilden die Stichprobenwerte y1,y2,,yny_1, y_2, \ldots, y_n, die aus der zu untersuchenden Grundgesamtheit mit dem Merkmal YY stammen. Diese Stichprobenwerte können als die realisierten Werte der Zufallsgrößen Y1,Y2,,YnY_1, Y_2, \ldots, Y_n betrachtet werden, die alle stochastisch unabhängig sind und dieselbe Verteilung aufweisen. Der Stichprobenumfang wird durch die Zahl nn repräsentiert.

Mittels einer adäquaten Schätzfunktion gg, die von den Stichprobenwerten abhängt, wird eine Punktschätzung ϑ^\hat{\vartheta} für den unbekannten Parameter bestimmt:

ϑ^=g(y1,y2,,yn).\hat{\vartheta} = g(y_1, y_2, \ldots, y_n).

Punktschätzwerte werden üblicherweise mit einem Dachsymbol gekennzeichnet, wie μ^\hat{\mu} für den Parameter μ\mu.

Das Ergebnis einer Schätzung hängt von der konkreten Stichprobe ab. Zieht man wiederholt Stichproben gleichen Umfangs aus derselben Grundgesamtheit, variiert der Punktschätzwert von Stichprobe zu Stichprobe, was zu einer Stichprobenverteilung des geschätzten Parameters führt. Der Zufallscharakter des Ergebnisses von Schätzfunktionen wird an dieser Stelle deutlich und spielt auch in der später behandelten Intervallschätzung eine Rolle. Setzt man die Zufallsvariablen Y1,Y2,,YnY_1, Y_2, \ldots, Y_n in die Schätzfunktion ein, wird der Zufallscharakter des Ergebnisses deutlich, was durch die Großbuchstabennotation Θ\Theta ausgedrückt wird:

Θ=g(Y1,Y2,,Yn).\Theta = g(Y_1, Y_2, \ldots, Y_n).

Funktionen, die von Zufallsvariablen abhängen, werden als Stichprobenfunktionen bezeichnet. Schätzfunktionen oder Schätzer sind spezielle Stichprobenfunktionen, die aufgrund ihrer spezifischen Eigenschaften zur Schätzung eines Parameters der Population geeignet sind.

Gewinnung von Schätzfunktionen

Die Schätztheorie untersucht, wie man geeignete, optimale Schätzfunktionen bestimmt. Es existieren verschiedene Ansätze zur Gewinnung von Schätzfunktionen, wobei die Maximum-Likelihood-Methode eine der bedeutendsten ist. Diese Methode geht davon aus, dass die vorliegende Stichprobe unter allen möglichen Stichproben die größte Wahrscheinlichkeit besitzt, aufzutreten. Diese Methode wird in den zuvor genannten Lehrbüchern detailliert behandelt. In diesem Kapitel konzentrieren wir uns jedoch nur auf die Ergebnisse, die durch derartige Methoden gewonnen werden.

Güte von Schätzfunktionen

Die Qualität einer Schätzfunktion wird anhand verschiedener Kriterien beurteilt. Nachfolgend sind einige wichtige Kriterien aufgelistet:

  • Erwartungstreue: Eine Schätzfunktion wird als erwartungstreu oder unverzerrt bezeichnet, wenn ihr Erwartungswert dem wahren Parameterwert entspricht. Erwartungstreue Schätzfunktionen würden bei ausreichend häufiger Wiederholung der Schätzung im Durchschnitt den wahren Parameterwert liefern.

  • Konsistenz: Eine Schätzfunktion ist konsistent, wenn sie mit zunehmender Stichprobengröße gegen den wahren Parameterwert konvergiert. Konsistente Schätzer werden also mit wachsendem Stichprobenumfang immer genauer.

  • Effizienz: Ein effizienter Schätzer weist unter allen unverzerrten Schätzern für denselben Parameter die geringste Varianz auf. Dies bedeutet, dass er die kleinste Streuung um den wahren Parameterwert besitzt, also präzisere Schätzungen liefert.

Als nächstes werden wir geeignete Schätzfunktionen für den Erwartungswert und die Varianz untersuchen und jeweils deren Güte bewerten. Wie bereits erwähnt, gehen wir in hier davon aus, dass es sich bei der zu analysierenden Grundgesamtheit um eine Normalverteilung handelt.

Schätzung des Erwartungswerts und dessen Güte

Der Stichprobenmittelwert ist ein typisches Beispiel für eine Punktschätzung des Erwartungswerts. Durch die Anwendung der Maximum-Likelihood-Methode kann gezeigt werden, dass der Stichprobenmittelwert yˉ\bar{y} einer Zufallsstichprobe als geeigneter Schätzwert μ^\hat{\mu} für den unbekannten Erwartungswert μ\mu einer Wahrscheinlichkeitsverteilung betrachtet werden kann:

μ^=yˉ=1ni=1nyi.\hat{\mu} = \bar{y} = \frac{1}{n} \sum_{i=1}^{n} y_i.

Dieser Schätzwert stellt eine Realisierung der Schätzfunktion Yˉ\bar{Y} dar, definiert als:

Yˉ=1ni=1nYi.\bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i.

Güte der Schätzung

Die Schätzfunktion Yˉ\bar{Y} weist die drei oben aufgeführten Eigenschaften auf:

  • Erwartungstreue: Da der Erwartungswert jeder Stichprobenvariable E(Yi)=μ\operatorname{E}(Y_i)=\mu beträgt, kann gezeigt werden (z.B. in Lange und Mosler, 2017), dass auch der Erwartungswert der Stichprobenfunktion diesem Wert entspricht:

    E(Yˉ)=μ.\operatorname{E}(\bar{Y}) = \mu.

    Der Schätzer ist also erwartungstreu.

  • Konsistenz: Wenn die Varianz der Grundgesamtheit, σ2\sigma^2, bekannt ist, beträgt auch die Varianz der Stichprobenvariablen Var(Yi)=σ2\operatorname{Var}(Y_i)=\sigma^2. Daher kann gezeigt werden (z.B. in Lange und Mosler, 2017), dass die Varianz des Stichprobenmittels

    Var(Yˉ)=σ2n\operatorname{Var}(\bar{Y}) = \frac{\sigma^2}{n}

    beträgt. Ist σ2\sigma^2 hingegen nicht bekannt, wird dieser Wert mithilfe der Stichprobenvarianz s2s^2 aus den Stichprobendaten geschätzt. Da der Schätzer Yˉ\bar{Y} für jeden Stichprobenumfang erwartungstreu ist und seine Varianz mit steigendem Stichprobenumfang gegen Null konvergiert, ist der Schätzer konsistent.

  • Effizienz: Die Schätzfunktion Yˉ\bar{Y} ist effizient, da sie unter den erwartungstreuen Schätzfunktionen für den Mittelwert bei einem gegebenen Stichprobenumfang die geringste Varianz aufweist.

Schätzung der Varianz und deren Güte

Die empirische Varianz einer Stichprobe kann als Maß für die Streuung der Beobachtungswerte um ihren Mittelwert verwendet werden. Die Formel zur Berechnung dieser Varianz, hier mit semp2s_\text{emp}^2 bezeichnet, lautet:

semp2=1ni=1n(yiyˉ)2.s_\text{emp}^2 = \frac{1}{n} \sum_{i=1}^n (y_i - \bar{y})^2.

Statt der empirischen Varianz wird in der Praxis jedoch oft die korrigierte empirische Varianz, hier mit s2s^2 bezeichnet, als Schätzwert σ^2\hat{\sigma}^2 für die Varianz σ2\sigma^2 verwendet:

σ^2=s2=1n1i=1n(yiyˉ)2.\hat{\sigma}^2 = s^2 = \frac{1}{n-1} \sum_{i=1}^n (y_i - \bar{y})^2.

Die zu s2s^2 zugehörige Schätzfunktion S2S^2 lautet:

S2=1n1i=1n(YiYˉ)2.S^2 = \frac{1}{n-1} \sum_{i=1}^n (Y_i - \bar{Y})^2.

Im Folgenden sprechen wir statt von der korrigierten empirischen Varianz jedoch nur von der Stichprobenvarianz. Es ist zu beachten, dass sowohl die Benennungen als auch die entsprechenden Notationen in der Literatur nicht einheitlich verwendet werden. Das heißt, es ist darauf zu achten, welche Konvention bzw. Definition im entsprechenden Kontext gilt.

Die korrigierte Form der Varianz berücksichtigt, dass der unbekannte Erwartungswert selbst aus den Daten geschätzt wurde. Deshalb verringert sich auch der Freiheitsgrad im Nenner von nn auf n1n-1. Diese Form der Varianz führt im Unterschied zur ersten Form zu einem erwartungstreuen Schätzer.

Für die Schätzung der Standardabweichung σ\sigma der Grundgesamtheit wird die Quadratwurzel der Schätzfunktion der Stichprobenvarianz, also S=S2S = \sqrt{S^2}, verwendet. Diese Funktion ist jedoch nicht erwartungstreu, sondern neigt zu einer leichten Unterschätzung des wahren Wertes.

Güte der Schätzung

Die Güte des Schätzers S2S^2 wird wieder anhand der folgenden Kriterien beurteilt:

  • Erwartungstreue: Der Erwartungswert des Schätzers beträgt (Lange und Mosler, 2017):

    E(S2)=σ2.\operatorname{E}(S^2) = \sigma^2.

    Das heißt, der Schätzer ist erwartungstreu.

  • Konsistenz: Die Varianz des Schätzers ist durch folgende Formel gegeben (Timischl 2016):

    Var(S2)=2σ4n1.\operatorname{Var}(S^2) = \frac{2\sigma^4}{n-1}.

    Das heißt, die Varianz nimmt mit wachsendem Stichprobenumfang ab, sodass es sich bei S2S^2 um einen konsistenten Schätzer handelt.

  • Effizienz: Da der Schätzer unter der Bedingung einer normalverteilten Grundgesamtheit und bei gegebenem Stichprobenumfang nn die geringstmögliche Varianz unter allen unverzerrten Schätzern aufweist, handelt es sich um einen effizienten Schätzer (Bankhofer und Vogel, 2008).

Grenzen von Punktschätzungen

Eine Schätzfunktion, die den oben genannten Qualitätskriterien entspricht, wird bei ausreichend großem Stichprobenumfang im Durchschnitt korrekte Punktschätzungen liefern. Jedoch erreicht eine Punktschätzung den wahren Parameterwert in der Regel nur zufällig exakt und kann weder die Zuverlässigkeit des Schätzwertes noch die Größe des Schätzfehlers quantifizieren.

Im Gegensatz dazu bezieht die nachfolgend behandelte Intervallschätzung ein Konfidenz- oder Vertrauensniveau mit in die Schätzung ein. Dadurch kann die Unsicherheit des Schätzwertes explizit bewertet werden.

Intervallschätzung

Die Intervallschätzung erweitert das Konzept der Punktschätzung, indem sie nicht nur einen einzelnen Schätzwert ϑ^\hat{\vartheta} für einen unbekannten Parameter ϑ\vartheta liefert, sondern ein Schätzintervall.

Ein Intervall [Θu,Θo][\Theta_\text{u}, \Theta_\text{o}] wird als zweiseitiges Konfidenzintervall zum Konfidenzniveau γ\gamma bezeichnet, wenn die Bedingung

P(Θu<ϑ<Θo)=γ\operatorname{P}(\Theta_\text{u} < \vartheta < \Theta_\text{o}) = \gamma

erfüllt wird. Hierbei ist γ\gamma das Konfidenzniveau, auch bekannt als Konfidenzwahrscheinlichkeit oder Überdeckungswahrscheinlichkeit. Dies bedeutet, dass der wahre Wert des Parameters ϑ\vartheta vom Konfidenzintervall mit dieser vorgegebenen Wahrscheinlichkeit überdeckt wird.

Da die Grenzen des Intervalls Stichprobenfunktionen, also Zufallsvariablen, sind, wird auch das Konfidenzintervall zu einem ‘Zufallsintervall’. Erst durch konkrete Stichprobenwerte können Realisierungen der Zufallsvariablen bestimmt werden, die die Intervallgrenzen ϑu\vartheta_\text{u} und ϑo\vartheta_\text{o} des Schätzintervalls, also der Konfidenzintervall-Schätzung, bilden.

Das Konfidenzniveau γ\gamma, üblicherweise festgelegt auf 90%, 95% oder 99%, spiegelt das Vertrauen in die Schätzung wider. Der Komplementärwert α=1γ\alpha = 1 - \gamma repräsentiert die Irrtumswahrscheinlichkeit, d.h., die Wahrscheinlichkeit, dass das Intervall den wahren Parameterwert nicht überdeckt.

Die spezifische Wahl der Stichprobenfunktionen Θu\Theta_\text{u} und Θo\Theta_\text{o} sowie deren Berechnung für Parameter wie den Erwartungswert und die Varianz werden in den folgenden Abschnitten erläutert. Dabei wird auch der Begriff ‘Überdeckung des wahren Parameters’ veranschaulicht.

Stichprobe generieren

Das Beispiel beginnt mit der Ziehung einer Stichprobe aus einer Grundgesamtheit, wobei wieder ein Merkmal YY untersucht werden soll. Die Grundgesamtheit sei standardnormalverteilt (Erwartungswert μ=0\mu=0 und Standardabweichung σ=1\sigma=1).

Die folgende Abbildung zeigt die zugehörige Wahrscheinlichkeitsverteilung dieser Grundgesamtheit. Mittels einer Schaltfläche kann eine Stichprobe erzeugt werden, deren Umfang nn über einen Schieberegler variiert werden kann. Der Maximalwert von nn wird hier nur aus Gründen der Darstellbarkeit begrenzt.




Nach der Ziehung einer Stichprobe wird die Häufigkeitsverteilung der Stichprobe in der Abbildung als Dot-Plot-Histogramm dargestellt. In dieser Darstellungsform entspricht jeder Punkt einem einzelnen Datenpunkt aus der Stichprobe. Bei dieser Darstellungsform muss beachtet werden, dass die Datenpunkte in Klassen (englisch bins) eingeteilt werden, um eine vertikale Stapelung zu ermöglichen. Dadurch kann jedoch der Anschein erweckt werden, als würden Datenpunkte mit unterschiedlichen Stichprobenwerten die gleichen Werte aufweisen.

Zusätzlich wird in der Abbildung der Stichprobenmittelwert yˉ\bar{y}, die Stichprobenvarianz s2s^2 und die Stichprobenstandardabweichung ss angezeigt. Diese Werte werden nach den zuvor angegebenen Formeln berechnet und sind Punktschätzer für den Erwartungswert μ\mu, die Varianz σ2\sigma^2 und die Standardabweichung σ\sigma. Diese Schätzwerte sind Realisierungen der zuvor definierten Schätzfunktionen Yˉ\bar{Y}, S2S^2 und SS. Da diese Schätzfunktionen von den Zufallsvariablen YiY_i abhängen, sind auch Yˉ\bar{Y}, S2S^2 und SS Zufallsvariablen mit berechenbaren Stichprobenverteilungen. Diese Stichprobenverteilungen werden in den nächsten Abschnitten für die Berechnung der Schätzintervalle verwendet.

Schätzintervall für den Erwartungswert

Die Verteilung von Yˉ\bar{Y}, d. h. die Stichprobenverteilung des Stichprobenmittelwerts, wird als Grundlage zur Berechnung des Schätzintervalls verwendet.

Zunächst betrachten wir den Fall, dass die Standardabweichung der Grundgesamtheit zum Zeitpunkt der Stichprobenziehung bekannt ist. Unter dieser Annahme folgt YY einer Normalverteilung mit den Parametern μ\mu und σ\sigma. Daraus ergibt sich, dass Yˉ\bar{Y} ebenfalls einer Normalverteilung folgt. Der Erwartungswert μyˉ\mu_{\bar{y}} dieser Verteilung entspricht dem Stichprobenmittelwert, also μyˉ=yˉ\mu_{\bar{y}} = \bar{y}. Die Standardabweichung dieser Verteilung, mit σyˉ\sigma_{\bar{y}} bezeichnet, beträgt σ/n\sigma/\sqrt{n}, also dem Standardfehler des Mittelwerts.

Für den Fall, dass die Standardabweichung der Grundgesamtheit nicht bekannt ist, wird diese durch die Stichprobenstandardabweichung geschätzt. In diesem Fall ist die Stichprobenverteilung nicht mehr normalverteilt, sondern t-verteilt.

In der folgenden Abbildung ist die Stichprobenverteilung dargestellt. Über das Dropdown-Menü kann ausgewählt werden, ob die Standardabweichung der Grundgesamtheit bekannt sein soll oder nicht. Ist sie nicht bekannt und der Stichprobenumfang relativ klein, ist der Unterschied zwischen den beiden Verteilungen gut zu erkennen, da die Verteilungsdichte bei der t-Verteilung breiter ist als bei der Normalverteilung.



Der Maßstab der horizontalen Achse in der obigen Abbildung kann durch Anklicken und Ziehen variiert werden und durch Doppelklicken zurückgesetzt werden. Der ursprüngliche Maßstab entspricht dem Maßstab der vorherigen Abbildung. Dadurch wird der Einfluss des Stichprobenumfangs auf die Stichprobenverteilung deutlich. Hat man zum Beispiel einen besonders kleinen Stichprobenumfang gewählt, wird der Standardfehler des Mittelwerts und damit die Streuung dieser Verteilung besonders groß.

Darüber hinaus kann über das Dropdown-Menü ein Konfidenzniveau γ\gamma ausgewählt werden. Ausgehend von diesem Konfidenzniveau wird ein um den Punktschätzwert yˉ\bar{y} symmetrisches Schätzintervall [yˉu, yˉo][\bar{y}_\text{u},~\bar{y}_\text{o}] bestimmt. Dieses Intervall wird so konstruiert, dass der Flächeninhalt unter der Kurve – begrenzt durch das Schätzintervall – dem Konfidenzniveau entspricht. Der komplementäre Bereich zu dieser Fläche entspricht der Irrtumswahrscheinlichkeit α\alpha.

Typische Werte bei der Auswahl des Konfidenzniveaus sind 90%, 95% und 99%. Die Wahl des Konfidenzniveaus hängt von der gewünschten Genauigkeit und der spezifischen Problemstellung ab.

In der obigen Abbildung verändert sich die Farbe der Fläche unter der Verteilungskurve, je nachdem, ob das Schätzintervall den wahren Erwartungswert der Grundgesamtheit (hier μ=0\mu=0) überdeckt oder nicht. Grün zeigt an, dass der wahre Wert überdeckt wird, während Rot anzeigt, dass er nicht überdeckt wird.

Wenn die Stichprobenziehung sehr oft wiederholt wird, ist zu erwarten, dass die ermittelten Schätzintervalle in γ100%\gamma \cdot 100\% aller Fälle den unbekannten Parameter enthalten (überdecken), also ein “grünes Intervall” auftritt. Demnach wird in α100%\alpha \cdot 100\% der Fälle ein “rotes Intervall” auftreten.

Mithilfe der folgenden Animation wird dieser Zusammenhang veranschaulicht. Über die Schaltflächen können Wiederholungen von Stichprobenziehungen ausgeführt werden. Für jede Stichprobenziehung wird das berechnete Schätzintervall im Diagramm angezeigt. Die Farbe des Intervalls gibt wieder an, ob der wahre Wert überdeckt wird oder nicht. Außerdem ist der Anteil rr zwischen Überdeckung und Nicht-Überdeckung in der Abbildung angegeben.

Stichprobenziehungen (Wiederholungen)





Mit zunehmender Anzahl an Wiederholungen strebt der Wert rr gegen das zuvor festgelegte Konfidenzniveau γ\gamma. Das heißt, wenn die Berechnung für viele Stichproben aus derselben Grundgesamtheit wiederholt wird, wird sich in γ100%\gamma \cdot 100\% der Fälle ein Schätzintervall ergeben, das den wahren Wert des betrachteten Parameters überdeckt.

Standardisierte Zufallsvariablen

Nach der oben beschriebenen Vorgehensweise lassen sich konkrete Werte für die untere und obere Grenze des Schätzintervalls für den Erwartungswert berechnen. Bei manueller Bestimmung von Schätzintervallen oder bei der Intervallschätzung für die Varianz erfolgt die Berechnung jedoch auf Basis von standardisierten Zufallsvariablen und standardisierten Verteilungen. Bei der manuellen Durchführung kann man dadurch auch auf tabellierte Werte von Wahrscheinlichkeitsverteilungen zurückgreifen.

Durch Standardisierung wird für den ersten Fall (bekannte Varianz) aus der normalverteilten Zufallsvariable Yˉ\bar{Y} die standardnormalverteilte Zufallsvariable ZZ. Die Standardisierung erfolgt über die z-Transformation, also:

Z=Yˉμσ/nN(0,1).Z = \frac{\bar{Y} - \mu}{\sigma / \sqrt{n}} \sim \operatorname{N}(0,1).

Für den zweiten Fall (unbekannte Varianz) wird aus der Zufallsvariable Yˉ\bar{Y} die t-verteilte Zufallsvariable TT mit n1n-1 Freiheitsgraden, bei der statt der Standardabweichung σ\sigma die aus der Stichprobe geschätzte Standardabweichung ss verwendet wird:

T=Yˉμs/nt(n1).T = \frac{\bar{Y} - \mu}{s / \sqrt{n}} \sim \operatorname{t}(n-1).

In beiden Fällen wird das um Null symmetrische Vertrauensintervall [zu,zo][z_\text{u}, z_\text{o}] bzw. [tu,to][t_\text{u}, t_\text{o}] anhand der folgenden Bedingungen bestimmt:

P(zuZzo)=γP(tuTto)=γ\begin{align} \operatorname{P}(z_\text{u} \leq Z \leq z_\text{o}) &= \gamma \\ \operatorname{P}(t_\text{u} \leq T \leq t_\text{o}) &= \gamma \end{align}

Die nachfolgende Abbildung zeigt die Wahrscheinlichkeitsdichte und die um Null symmetrische Fläche unter dieser Kurve, die einen Flächeninhalt entsprechend des Konfidenzniveaus einnimmt. Der linke und rechte Teil unter der Kurve, außerhalb des Schätzintervalls, besitzt jeweils einen Flächeninhalt von α/2\alpha/2.



Mit diesem Wissen über die Aufteilung der Flächeninhalte lassen sich die Grenzen des Intervalls bestimmen. Wir suchen zum einen den Wert von zuz_\text{u} (bzw. tut_\text{u}), sodass der unter der Kurve liegende Flächeninhalt von -\infty bis zu diesem Wert dem Wert α/2\alpha/2 entspricht. Darüber hinaus suchen wir den Wert von zoz_\text{o} (bzw. tot_\text{o}), sodass der unter der Kurve liegende Flächeninhalt von -\infty bis zu diesem Wert dem Wert α/2+γ=1α/2\alpha/2 + \gamma = 1 - \alpha/2 entspricht. Diese Werte können wir entweder mithilfe von Statistiksoftware oder unter Verwendung von tabellierten Werten der jeweiligen Wahrscheinlichkeitsverteilung ermitteln.

Durch die Nutzung einer Software können diese Werte mithilfe der Quantilsfunktion für die entsprechende Wahrscheinlichkeitsverteilung berechnet werden. Die Quantilsfunktion ist die inverse Funktion der Verteilungsfunktion. Sie gibt für einen gegebenen Wahrscheinlichkeitswert pp (also Flächeninhalt unter der Dichtekurve) den zugehörigen Wert zz (bzw. tt) zurück. Also bei gegebenen Flächeninhalt, gibt diese Funktion die Grenze an, die diese Fläche bestimmt.

Alternativ werden diese Werte mithilfe von Tabellenwerten (z.B. bei Papula, 2017) für gegebene Quantile (z.B. 0.90, 0.95, 0.975, 0.99) bestimmt. Durch Symmetrieeigenschaften können auch die Werte für die Gegenquantile bestimmt werden.

In der nachfolgenden Tabelle sind typische Wertepaare von Wahrscheinlichkeiten und zugehörige Quantile für die Standardnormalverteilung aufgeführt:

pp zz
0.90 1.282
0.95 1.645
0.975 1.960
0.99 2.326

Bei der Benutzung einer t-Verteilung ist sowohl bei der Auswertung der Quantilsfunktion mithilfe einer Statistiksoftware als auch bei der Benutzung einer Tabelle noch der zugrundeliegende Freiheitsgrad zu berücksichtigen. Die Verwendung unterscheidet sich im Prinzip aber nicht.

Anhand der Definition von ZZ und TT sowie den zuvor aufgestellten Bedingungen P(zuZzo)=γ\operatorname{P}(z_\text{u} \leq Z \leq z_\text{o}) = \gamma bzw. P(tuTto)=γ\operatorname{P}(t_\text{u} \leq T \leq t_\text{o}) = \gamma können Ungleichungen für den unbekannten Mittelwert formuliert werden, die die Bestimmungsgleichungen für die untere und obere Grenzen für die Konfidenzintervalle beinhalten:

zuZzozuYˉμσ/nzoYˉ+zuσnμYˉ+zoσn\begin{array}{rrlcll} &z_\text{u} & \leq & Z & \leq & z_\text{o}\\ \Leftrightarrow & z_\text{u} &\leq& \frac{ \bar{Y} - \mu}{\sigma / \sqrt{n}} & \leq& z_\text{o}\\ \Leftrightarrow & \bar{Y} + z_\text{u} \frac{\sigma}{\sqrt{n}} &\leq& \mu &\leq & \bar{Y} + z_\text{o} \frac{\sigma}{\sqrt{n}} \end{array}

Für den zweiten Fall unter Verwendung der t-Verteilung erfolgt die Vorgehensweise analog.

Auf diese Weise können die folgenden Formeln für die Grenzen der Schätzintervalle bestimmt werden, wobei wir für die Schätzfunktion Yˉ\bar{Y} den aus der Stichprobe ermittelten Schätzwert yˉ\bar{y} verwenden:

yˉu=yˉ+zuσnundyˉo=yˉ+zoσnbzw.yˉu=yˉ+tusnundyˉo=yˉ+tosn.\begin{align*} \bar{y}_\text{u} &= \bar{y} + z_\text{u} \frac{\sigma}{\sqrt{n}} \qquad \text{und} \\ \bar{y}_\text{o} &= \bar{y} + z_\text{o} \frac{\sigma}{\sqrt{n}} \qquad \text{bzw.} \\ &\\ \bar{y}_\text{u} &= \bar{y} + t_\text{u} \frac{s}{\sqrt{n}} \qquad \text{und} \\ \bar{y}_\text{o} &= \bar{y} + t_\text{o} \frac{s}{\sqrt{n}}. \end{align*}

Da zu=zoz_\text{u} = -z_\text{o} bzw. tu=tot_\text{u} = -t_\text{o} erkennt man, dass es sich um ein um yˉ\bar{y} symmetrisches Intervall handelt.

Schätzintervall für die Varianz

Ähnlich wie für den Erwartungswert kann auch für die Varianz einer normalverteilten Grundgesamtheit ein Schätzintervall bestimmt werden. Wir gehen von einer Grundgesamtheit mit einem (bekannten oder unbekannten) Erwartungswert μ\mu und einer unbekannten Varianz σ2\sigma^2 aus. Aus einer konkreten Zufallsstichprobe soll ein Schätzintervall für diese Varianz bestimmt werden. Als Schätzfunktion verwenden wir die zuvor definierte Stichprobenfunktion für die korrigierte empirische Varianz. Auf deren Grundlage lässt sich eine Zufallsvariable (Stichprobenfunktion) QQ bilden, die einer Chi-Quadrat-Verteilung mit ν=n1\nu = n - 1 Freiheitsgraden folgt:

Q=(n1)S2σ2χ2(n1).Q = (n - 1) \frac{S^2}{\sigma^2} \sim \chi^2(n-1).

Nach Festlegung eines bestimmten Konfidenzniveaus γ\gamma können die Grenzen quq_\text{u} und qoq_\text{o} so bestimmt werden, dass die Zufallsvariable mit der Wahrscheinlichkeit γ\gamma Werte innerhalb dieser Grenzen annimmt. Die Berechnung der Intervallgrenzen erfolgt nach der Bedingung

P(quQqo)=γ=1α.\operatorname{P}(q_\text{u} \leq Q \leq q_\text{o}) = \gamma = 1 - \alpha.

Der Flächenanteil der Irrtumswahrscheinlichkeit α\alpha wird dabei gleichmäßig auf beide Seiten der Dichtefunktion verteilt. Die folgende Abbildung zeigt die Dichtefunktion der Chi-Quadrat-Verteilung mit zur Stichprobe passenden Freiheitsgraden. Darüber hinaus ist der Flächeninhalt passend zum Konfidenzniveau sowie die untere und obere Grenze des Schätzintervalls angegeben.



Die Berechnung der Werte für quq_\text{u} und qoq_\text{o} erfolgt wieder wie oben beschrieben mithilfe von Statistiksoftware und der Quantilsfunktion oder mit tabellierten Werten der Chi-Quadrat-Verteilung.

Aus der oben genannten Bedingung und folgenden Umformungen können die untere und obere Grenze für das Schätzintervall der Varianz bestimmt werden, wobei für die Schätzfunktion S2S^2 der ermittelte Schätzwert s2s^2 verwendet wird:

quQqoqu(n1)S2σ2qo(n1)S2qoσ2(n1)S2qu.\begin{array}{rrlcll} & q_\text{u} &\leq& Q & \leq& q_\text{o}\\ \Leftrightarrow & q_\text{u} &\leq& (n - 1) \frac{S^2}{\sigma^2} & \leq& q_\text{o}\\ \Leftrightarrow & (n - 1) \frac{S^2}{q_\text{o}} &\leq& \sigma^2 & \leq& (n - 1) \frac{S^2}{q_\text{u}}. \end{array}

Manuelle Durchführung

Um das Verständnis für die hier vorgestellte Methode zu vertiefen, erfolgt zunächst eine manuelle Durchführung eines Anwendungsbeispiels, gefolgt von der Durchführung mit R und SPSS.

Für Demonstrationszwecke wird der mice-Datensatz aus dem R-Paket datarium verwendet. Dieses Paket beinhaltet eine Vielzahl von Datensätzen, die häufig zur Veranschaulichung statistischer Methoden genutzt werden. Die nachfolgende Datentabelle enthält die Messwerte dieses Datensatzes.

Der verwendete Datensatz enthält zehn Zeilen und zwei Spalten, wobei die erste Spalte einen Bezeichner und die zweite das Gewicht von Mäusen in Gramm enthält. Diese Gewichtsmessungen entsprechen den beobachteten Merkmalswerten y1,y2,,yny_1, y_2, \dots, y_n.

Anhand dieses Datensatzes sollen zuerst Punktschätzungen und anschließend Intervallschätzungen für den Erwartungswert und die Varianz der zugrundeliegenden Grundgesamtheit bestimmt werden. Das Konfidenzniveau soll γ=0.95\gamma=0.95 betragen.

Der Stichprobenumfang nn entspricht der Anzahl an Messwerten: n=10 .n = 10~.

Aus den Daten lassen sich der Stichprobenmittelwert yˉ\bar{y}, die Stichprobenvarianz s2s^2 und die Stichprobenstandardabweichung ss bestimmen. Dabei handelt es sich um Punktschätzwerte für den jeweiligen Parameter. Die hier gezeigten Zahlenwerte werden mit maximal vier signifikanten Stellen und ohne Einheiten angegeben:

yˉ=1ni=1nyi=20.14 ,s2=1n1i=1n(yiyˉ)2 =3.596 ,s=s2=1.896 .\begin{align*} \bar{y} &= \frac{1}{n} \sum_{i=1}^{n}y_i \\ &= 20.14~,\\ &\\ s^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (y_i - \bar{y})^2~ \\ &= 3.596~, \\ &\\ s &= \sqrt{s^2} \\ &= 1.896~. \end{align*}

Als nächstes bestimmen wir die Grenzen der Konfidenzintervalle, zuerst für den Mittelwert, dann für die Varianz. Da die Varianz der Grundgesamtheit unbekannt ist, basiert die Intervallschätzung auf der t-Verteilung. Die Anzahl der Freiheitsgrade, ν\nu, beträgt ν=n1=9 .\begin{align*} \nu&=n-1\\ &=9~. \end{align*}

Mithilfe einer Tabelle lassen sich die Werte tut_\text{u} und tot_\text{o} zu den Quantilen α/2\alpha/2 und 1α/21-\alpha/2 bestimmen. Tatsächlich muss nur der Wert des zweiten Quantils bestimmt werden, da sich der andere Wert aus Gründen der Symmetrie ergibt.

Die nachfolgende Tabelle (z.B. Papula, 2017) enthält für spezielle Wahrscheinlichkeitswerte pp das jeweils zugehörige Quantil der t-Verteilung bei ν\nu Freiheitsgraden.

p
ν 0.9 0.95 0.975 0.99 0.995
1 3.078 6.314 12.71 31.82 63.66
2 1.886 2.92 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.44 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.86 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.25
10 1.372 1.812 2.228 2.764 3.169

Aus der Tabelle lassen sich für die Wahrscheinlichkeit p=0.975p=0.975 der Wert to=2.262t_\text{o}=2.262 ablesen. Damit ergibt sich wegen der Symmetrie der Wert tut_\text{u} zu tu=2.262t_\text{u}=-2.262.

Die Grenzen des Schätzintervalls lassen sich somit wie folgt berechnen:

yˉu=yˉ+tusn=20.14+(2.262) 1.89610=18.78yˉo=yˉ+tosn=20.14+(2.262) 1.89610=21.5\begin{align*} \bar{y}_\text{u} &= \bar{y} + t_\text{u} \frac{s}{\sqrt{n}}\\ &= 20.14 + (-2.262) ~\frac{ 1.896 }{\sqrt{ 10 }} \\ &= 18.78\\ & \\ \bar{y}_\text{o} &= \bar{y} + t_\text{o} \frac{s}{\sqrt{n}} \\ &= 20.14 + (2.262) ~\frac{ 1.896 }{\sqrt{ 10 }} \\ &= 21.5\\ \end{align*}

Zur Bestimmung der Intervallgrenzen für die Varianz können die Werte quq_\text{u} und qoq_\text{o} in ähnlicher Weise mithilfe tabellierter Werte für die Chi-Quadrat-Verteilung bestimmt werden.

Die nachfolgende Tabelle (z.B. Papula, 2017) enthält für spezielle Wahrscheinlichkeitswerte pp das jeweils zugehörige Quantil der Chi-Quadrat-Verteilung bei ν\nu Freiheitsgraden.

p
ν 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99 0.995
1 0 0 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879
2 0.01 0.02 0.051 0.103 0.211 4.605 5.991 7.378 9.21 10.6
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.34 12.84
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.14 13.28 14.86
5 0.412 0.554 0.831 1.145 1.61 9.236 11.07 12.83 15.09 16.75
6 0.676 0.872 1.237 1.635 2.204 10.64 12.59 14.45 16.81 18.55
7 0.989 1.239 1.69 2.167 2.833 12.02 14.07 16.01 18.48 20.28
8 1.344 1.646 2.18 2.733 3.49 13.36 15.51 17.53 20.09 21.95
9 1.735 2.088 2.7 3.325 4.168 14.68 16.92 19.02 21.67 23.59
10 2.156 2.558 3.247 3.94 4.865 15.99 18.31 20.48 23.21 25.19

Damit lassen sich die Werte qu=2.7q_\text{u}=2.7 und qo=19.02q_\text{o}=19.02 ablesen, und die Grenzen des Schätzintervalls wie folgt bestimmen:

su2=(n1) s2qo=(101) 3.59619.02=1.701so2=(n1) s2qu=(101) 3.5962.7=11.98 .\begin{align*} s^2_\text{u} &= (n-1) ~\frac{s^2}{q_\text{o}}\\ &= (10-1) ~\frac{ 3.596 }{19.02}\\ &= 1.701\\ & \\ s^2_\text{o} &= (n-1) ~\frac{s^2}{q_\text{u}}\\ &= (10-1) ~\frac{ 3.596 }{2.7}\\ &= 11.98~. \end{align*}

Durchführung in R

Sowohl die Punkt- als auch die Intervallschätzungen werden in R mithilfe interner Funktionen berechnet, ohne dass zusätzliche Pakete geladen werden müssen.

Daten importieren

Hier wird der Datensatz mice aus dem Paket datarium verwendet. Da das Paket nicht standardmäßig installiert ist, muss es bei lokaler Ausführung gegebenenfalls über install.packages() installiert werden (hier jedoch nicht erforderlich). Über den Befehl library() und der Angabe des Namens des Paketes wird das Paket geladen. Durch die Angabe des Namens des Datensatzes wird dieser ausgegeben.

# install.packages("datarium")
library("datarium")
mice

Punktschätzung für den Erwartungswert und die Varianz

Zuerst definieren wir folgende Variablen mit festen Werten, Konfidenzniveau gamma, Irrtumswahrscheinlichkeit alpha und Freiheitsgrad nu:

gamma <- 0.95 
alpha <- 1 - gamma

Aus den Stichprobendaten kann der Stichprobenumfang sample_size und der Freiheitsgrad degrees_of_freedom berechnet werden:

sample_size <- length(mice$weight)
degrees_of_freedom <- sample_size - 1

Der Mittelwert mean_value wird über die Funktion mean() berechnet, die Varianz variance über die Funktion var(). Dies sind die Punktschätzungen für die gesuchten Parameter:

mean_value <- mean(mice$weight)
variance <- var(mice$weight)

Intervallschätzung für den Erwartungswert

Danach werden der Standardfehler für den Mittelwert, das Quantil der t-Verteilung für die gegebene Wahrscheinlichkeit und der Freiheitsgrad berechnet:

standard_deviation <- sd(mice$weight)
standard_error <- standard_deviation / sqrt(n)
t_score <- qt(p = 1-alpha/2, df = degrees_of_freedom) 
margin_error <- t_score * standard_error

Damit lassen sich die untere und obere Grenze berechnen und ausgeben:

lower_bound_mean <- mean_value - margin_error
upper_bound_mean <- mean_value + margin_error

# Ausgabe
lower_bound_mean
upper_bound_mean

Intervallschätzung für die Varianz

Für die Intervallschätzung der Varianz werden zuerst die Werte zu den Quantilen α/2\alpha/2 und 1α/21-\alpha/2 mithilfe der Quantilsfunktion der Chi-Quadrat-Verteilung bestimmt:

chi2_lower <- qchisq(p = alpha/2, df= degrees_of_freedom)
chi2_upper <- qchisq(p = 1 - alpha/2, df= degrees_of_freedom)

Abschließend können die untere und obere Grenze berechnet werden:

lower_bound_variance <- (n-1) * variance / chi2_upper 
upper_bound_variance <- (n-1) * variance / chi2_lower 

lower_bound_variance 
upper_bound_variance 

Durchführung in SPSS

In SPSS können die meisten Berechnungen über die graphische Benutzeroberfläche durchgeführt werden. Lediglich für die Berechnung des Konfidenzintervalls der Varianz ist die Ausführung von Syntax-Code notwendig.

Daten importieren

Wie zuvor wird auch hier der Datensatz mice aus dem Paket datarium verwendet. Die Daten können aus der nachfolgenden Datentabelle via Copy/Paste in den SPSS-Dateneditor in der Datenansicht eingefügt werden. Nach dem Einfügen der Spaltennamen muss die erste Zeile im Dateneditor manuell gelöscht werden.

Variablen benennen

Für eine bessere Nachvollziehbarkeit können die Spalten in der Variablenansicht umbenannt werden. In jedem Fall müssen der Typ, die Dezimalstellen und das Maß korrekt angegeben werden.

Punkt- und Intervallschätzwert für den Mittelwert

Die Berechnung erfolgt über die Menüabfolge Analysieren > Deskriptive Statistiken > Explorative Datenanalyse….

Als Abhängige Variable wird weight ausgewählt. Unter Statistiken… sollte die Option Deskriptive Statistik aktiviert und das Konfidenzintervall für den Mittelwert auf 95% eingestellt sein.

In der Ausgabe erscheinen der Mittelwert und das 95% Konfidenzintervall für den Mittelwert.

Punkt- und Intervallschätzwert für die Varianz

Die Berechnung startet über Analysieren > Deskriptive Statistiken > Deskriptive Statistik….

Als Variable(n) wird weight ausgewählt und unter Optionen… die Varianz aktiviert.

In der Ausgabe werden die Werte für den Stichprobenumfang und die Varianz angezeigt.

Schätzintervall der Varianz

Das zugehörige Schätzintervall wird mithilfe von Syntax-Code berechnet. Ein neues Eingabefenster für Syntax-Code wird über Datei > Neue Syntax geöffnet.

Der folgende Code kann in den Syntax-Editor eingefügt werden. Hier sind die Werte für den Stichprobenumfang, die Freiheitsgrade, das Signifikanzniveau und die Varianz bereits angepasst:

COMPUTE N = 10.
COMPUTE df = N - 1.
COMPUTE alpha = 0.05.
COMPUTE Varianz = 3.596.

COMPUTE Chi2_Lower = IDF.CHISQ(alpha/2, df).
COMPUTE Chi2_Upper = IDF.CHISQ(1-alpha/2, df).

COMPUTE Var_Lower = (df * Varianz) / Chi2_Upper.
COMPUTE Var_Upper = (df * Varianz) / Chi2_Lower.

EXECUTE.

Die Befehle werden ausgeführt, indem sie zunächst vollständig markiert (Strg + A) und dann mit Strg + R ausgeführt werden.

Das berechnete Schätzintervall wird in den neu erzeugten Spalten angezeigt.

Wie erwartet, stimmen die Werte mit den manuell und mit R berechneten Werten überein.

Literaturverzeichnis

Bankhofer, U., Vogel, J. (2008). Datenanalyse und Statistik: Eine Einführung für Ökonomen im Bachelor. Gabler.

Dietmaier, C. (2014). Mathematik für angewandte Wissenschaften. Springer Spektrum.

Lange, T., Mosler, K. (2017). Statistik kompakt: Basiswissen für Ökonomen und Ingenieure. Springer Gabler

Papula, L. (2016). Mathematik für Ingenieure und Naturwissenschaftler - Band 3 - Vektoranalysis, Wahrscheinlichkeitsrechnung, Mathematische Statistik, Fehler- und Ausgleichsrechnung (7. Auflage). Springer Vieweg.

Papula, L. (2017). Mathematische Formelsammlung: Für Ingenieure und Naturwissenschaftler (12. Auflage). Springer Vieweg.

Timischl, W. (2016). Mathematische Methoden in den Biowissenschaften: Eine Einführung mit R (3. Auflage). Springer Spektrum.

Schätztheorie

Bernhard Poethke