https://novustat.com/statistik-blog/klassiker-lineare-regression-einfach-erklaert.html
Woche 1-2: Das einfache lineare Regressionsmodell
Ziel
Verständnis der Grundlagen des einfachen linearen Regressionsmodells, Anwendung und Interpretation der Ergebnisse.
Inhalte
Einführung in die Regression
Die Regression ist eine statistische Methode zur Untersuchung von Beziehungen zwischen Variablen. Das einfache lineare Regressionsmodell beschreibt die Beziehung zwischen einer abhängigen Variable (Zielvariable) und einer unabhängigen Variable (Prädiktor) durch eine lineare Funktion.
Allgemeine Form des einfachen linearen Regressionsmodells
- : abhängige Variable
- : unabhängige Variable
- : Achsenabschnitt
- : Steigungskoeffizient
- : Fehlerterm
Annahmen des einfachen linearen Regressionsmodells
- Linearität: Die Beziehung zwischen und ist linear.
- Unabhängigkeit: Die Residuen sind voneinander unabhängig.
- Homoskedastizität: Die Varianz der Residuen ist konstant für alle Werte von .
- Normalverteilung der Residuen: Die Residuen sind normalverteilt.
Schätzung der Regressionsparameter
Die Regressionsparameter und werden durch die Methode der kleinsten Quadrate geschätzt, die die Summe der quadrierten Abweichungen der beobachteten Werte von den vorhergesagten Werten minimiert.
Formel zur Schätzung der Parameter
Bestimmung der Güte des Modells
Bestimmtheitsmaß ()
- gibt den Anteil der Variation der abhängigen Variable an, der durch das Modell erklärt wird.
Adjusted
Das adjustierte berücksichtigt die Anzahl der Prädiktoren im Modell und wird wie folgt berechnet:
- : Anzahl der Beobachtungen
- : Anzahl der Prädiktoren
Hypothesentests (t-Tests und F-Tests)
t-Test für die Regressionskoeffizienten
Der t-Test prüft, ob ein Regressionskoeffizient signifikant von Null verschieden ist:
- : geschätzter Regressionskoeffizient
- : Standardfehler des geschätzten Regressionskoeffizienten
F-Test für das Gesamtmodell
Der F-Test prüft, ob das Modell insgesamt signifikant ist:
- : Mittlere Quadratsumme der Regression
- : Mittlere Quadratsumme des Fehlers
Konfidenz- und Vorhersageintervalle
Konfidenzintervalle für die Regressionskoeffizienten
Ein Konfidenzintervall gibt den Bereich an, in dem der wahre Wert des Regressionskoeffizienten mit einer bestimmten Wahrscheinlichkeit liegt.
Vorhersageintervalle für neue Beobachtungen
Ein Vorhersageintervall gibt den Bereich an, in dem eine neue Beobachtung mit einer bestimmten Wahrscheinlichkeit liegt.
Anwendung in R oder Python
Beispiel in R
Beispiel in Python
Übungen
-
Datensätze laden und visualisieren
- Laden Sie einen Datensatz und visualisieren Sie die Beziehung zwischen der abhängigen und der unabhängigen Variable.
-
Einfache lineare Regression durchführen und interpretieren
- Führen Sie eine einfache lineare Regression durch und interpretieren Sie die geschätzten Parameter, das Bestimmtheitsmaß und die Ergebnisse der Hypothesentests.
-
Residualanalyse
- Analysieren Sie die Residuen des Modells, um die Modellannahmen zu überprüfen.
Praktische Übung in R
Praktische Übung in Python
Dieses Skript gibt Ihnen eine umfassende Einführung in das einfache lineare Regressionsmodell, inklusive theoretischer Grundlagen, praktischer Beispiele und Übungen zur Vertiefung Ihres Wissens und Ihrer Fähigkeiten in der Anwendung und Interpretation der Ergebnisse.