Referenz: Gewichtete Kleinste-Quadrate (WLS) vs Normale Kleinste-Quadrate (OLS)
Die Kleinste-Quadrate-Schätzung (KQ-Schätzung) und ihre asymptotischen Eigenschaften
Einleitung
Die Kleinste-Quadrate-Schätzung (KQ-Schätzung) ist eine der grundlegendsten Methoden in der Statistik und Ökonometrie, die zur Schätzung der Parameter von Regressionsmodellen verwendet wird. Diese Methode minimiert die Summe der quadrierten Abweichungen zwischen den beobachteten und den durch das Modell vorhergesagten Werten. In diesem Dokument werden wir die KQ-Schätzung detailliert untersuchen, einschließlich ihrer mathematischen Grundlagen, Berechnungsmethoden und asymptotischen Eigenschaften, insbesondere wenn die Fehlerterme unabhängig und identisch verteilt (i.i.d.) sind.
Grundlagen der Kleinste-Quadrate-Schätzung
Einfache lineare Regression
Die einfache lineare Regression modelliert die Beziehung zwischen einer abhängigen Variable und einer unabhängigen Variable durch die folgende Gleichung:
Hierbei sind:
- der Achsenabschnitt,
- die Steigung der Regressionsgeraden,
- der Fehlerterm.
Die KQ-Schätzung zielt darauf ab, die Parameter und so zu bestimmen, dass die Summe der quadrierten Fehler (Residuals) minimiert wird:
Multiple lineare Regression
Die multiple lineare Regression erweitert das einfache Modell, indem sie mehrere unabhängige Variablen einbezieht:
Hierbei sind die unabhängigen Variablen und die Regressionskoeffizienten.
Die KQ-Schätzung minimiert die Summe der quadrierten Residuen auch in diesem Fall:
Berechnung der KQ-Schätzer
Einfache lineare Regression
In der einfachen linearen Regression werden die KQ-Schätzer und durch die folgenden Formeln berechnet:
Hierbei sind und die Mittelwerte der unabhängigen und abhängigen Variablen.
Multiple lineare Regression
In der multiplen linearen Regression werden die KQ-Schätzer durch die Normalengleichungen bestimmt:
wobei die Designmatrix, der Vektor der abhängigen Variablen und der Vektor der KQ-Schätzer ist. Die Lösung dieser Gleichung ist:
Eigenschaften der KQ-Schätzer
Unverzerrtheit
Ein Schätzer ist unverzerrt, wenn sein Erwartungswert gleich dem wahren Parameterwert ist:
Die KQ-Schätzer sind unverzerrt unter der Annahme, dass die Fehlerterme einen Erwartungswert von null haben ().
Effizienz
Ein Schätzer ist effizient, wenn er unter allen unverzerrten Schätzern die kleinste Varianz hat. Die KQ-Schätzer sind effizient, wenn die Fehlerterme homoskedastisch und unkorreliert sind.
Konsistenz
Ein Schätzer ist konsistent, wenn er mit wachsender Stichprobengröße gegen den wahren Parameterwert konvergiert:
Die KQ-Schätzer sind konsistent, wenn die unabhängigen Variablen nicht perfekt kollinear sind und die Fehlerterme homoskedastisch und unkorreliert sind.
Asymptotische Eigenschaften der KQ-Schätzer
Gesetz der großen Zahlen
Das Gesetz der großen Zahlen besagt, dass der Durchschnitt einer großen Anzahl von unabhängigen und identisch verteilten Zufallsvariablen gegen den Erwartungswert der Zufallsvariablen konvergiert. In Bezug auf die KQ-Schätzer bedeutet dies, dass die Schätzer bei großer Stichprobengröße gegen die wahren Parameterwerte konvergieren.
Zentraler Grenzwertsatz
Der zentrale Grenzwertsatz besagt, dass die Verteilung der Summe einer großen Anzahl von unabhängigen und identisch verteilten Zufallsvariablen approximativ normal ist, unabhängig von der Verteilung der einzelnen Variablen. Für die KQ-Schätzer bedeutet dies, dass ihre Verteilung bei großer Stichprobengröße approximativ normal ist.
Asymptotische Normalität
Die KQ-Schätzer sind asymptotisch normal verteilt. Das bedeutet, dass bei großer Stichprobengröße die Verteilung der KQ-Schätzer näherungsweise normal ist:
Hierbei ist die Kovarianzmatrix der unabhängigen Variablen und die Varianz der Fehlerterme.
Konsistenz und Asymptotische Effizienz
Die KQ-Schätzer sind konsistent und asymptotisch effizient, wenn die Fehlerterme unabhängig und identisch verteilt (i.i.d.) sind. Das bedeutet, dass die KQ-Schätzer nicht nur gegen die wahren Parameterwerte konvergieren, sondern auch die geringste mögliche asymptotische Varianz unter allen unverzerrten Schätzern haben.
KQ-Schätzung unter der Annahme von i.i.d. Fehlern
Unabhängige und identisch verteilte (i.i.d.) Fehler
Wenn die Fehlerterme unabhängig und identisch verteilt (i.i.d.) sind, erfüllen sie die folgenden Bedingungen:
Diese Annahmen vereinfachen die Analyse und führen zu klaren asymptotischen Eigenschaften der KQ-Schätzer.
Eigenschaften der KQ-Schätzer bei i.i.d. Fehlern
Unter der Annahme von i.i.d. Fehlern sind die KQ-Schätzer:
- Unverzerrt:
- Konsistent:
- Asymptotisch normal:
- Asymptotisch effizient: Sie haben die geringste asymptotische Varianz unter allen unverzerrten Schätzern.
Herleitung der asymptotischen Normalität
Die Herleitung der asymptotischen Normalität der KQ-Schätzer erfolgt in mehreren Schritten:
-
Erwartungswert und Varianz: Der Erwartungswert und die Varianz der KQ-Schätzer werden berechnet. Unter der Annahme von i.i.d. Fehlern gilt:
-
Standardisierung: Die KQ-Schätzer werden standardisiert, um eine zentrierte und skalierte Version zu erhalten:
-
Anwendung des zentralen Grenzwertsatzes: Der zentrale Gren
zwertsatz wird angewendet, um die asymptotische Normalität zu zeigen:
Praktische Anwendung und Beispiel
Datengenerierung und Modellschätzung
Um die KQ-Schätzung und ihre asymptotischen Eigenschaften zu illustrieren, generieren wir ein einfaches Datenset und schätzen ein Regressionsmodell.
Interpretation der Ergebnisse
Das obige Python-Skript generiert Daten für eine einfache lineare Regression und schätzt die Regressionskoeffizienten mit der KQ-Methode. Die Ausgabe des Modells zeigt die geschätzten Koeffizienten, ihre Standardfehler, t-Werte und p-Werte sowie das Konfidenzintervall.
Asymptotische Normalität
Die geschätzten Koeffizienten sollten bei ausreichender Stichprobengröße asymptotisch normal verteilt sein. Dies kann durch das Plotten der Residuen und Überprüfen der Normalverteilung der geschätzten Koeffizienten visualisiert werden.
Vertiefung: Asymptotische Eigenschaften bei Nicht-i.i.d. Fehlern
Heteroskedastizität
Wenn die Varianz der Fehlerterme nicht konstant ist (Heteroskedastizität), sind die KQ-Schätzer zwar weiterhin unverzerrt, aber nicht effizient. In diesem Fall sind alternative Schätzmethoden wie die gewichtete Kleinste-Quadrate-Schätzung (WLS) oder robuste Standardfehler erforderlich.
Autokorrelation
Wenn die Fehlerterme zeitlich korreliert sind (Autokorrelation), sind die KQ-Schätzer ebenfalls unverzerrt, aber nicht effizient. Methoden wie die Newey-West-Standardfehler oder die Generalized Least Squares (GLS) können verwendet werden, um die Effizienz der Schätzungen zu verbessern.
Abhängige Fehler
Wenn die Fehlerterme nicht unabhängig sind, sondern eine komplexe Abhängigkeitsstruktur aufweisen, müssen spezialisierte Modelle wie Mixed-Effects-Modelle oder Modelle mit Cluster-Robust-Standardfehlern verwendet werden.
Simulationen zur Veranschaulichung asymptotischer Eigenschaften
Simulation der KQ-Schätzer unter i.i.d. Fehlern
Um die asymptotischen Eigenschaften der KQ-Schätzer zu veranschaulichen, führen wir eine Simulation durch, bei der wir wiederholt Datensätze generieren, das Modell schätzen und die Verteilung der Schätzungen analysieren.
Diese Simulation zeigt, dass die Verteilung der geschätzten Koeffizienten bei ausreichender Stichprobengröße näherungsweise normal ist, was die asymptotische Normalität der KQ-Schätzer bestätigt.
Fazit
Die Kleinste-Quadrate-Schätzung (KQ-Schätzung) ist eine fundamentale Methode in der Regressionsanalyse, die durch ihre Einfachheit und Effizienz besticht. Unter der Annahme, dass die Fehlerterme unabhängig und identisch verteilt (i.i.d.) sind, besitzen die KQ-Schätzer attraktive Eigenschaften wie Unverzerrtheit, Konsistenz und asymptotische Normalität. Diese Eigenschaften machen die KQ-Schätzung zu einem leistungsfähigen Werkzeug für die Analyse linearer Regressionsmodelle. In der Praxis ist es jedoch wichtig, die Annahmen zu überprüfen und gegebenenfalls alternative Methoden anzuwenden, wenn diese Annahmen verletzt sind.