Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Lineare Regression / Multiple Regression

No description
by

Katrin Ehresmann

on 24 January 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Lineare Regression / Multiple Regression

Regressionsanalyse
Lineare Regression
Multiple Regression
Lineare Regression:
Versucht einen linearen Zusammenhang zwischen Einfluss- und Zielgröße herzustellen

Gerade durch die Punktewolke der Messungen

r gibt die Stärke der Linearität eines Zusammenhangs an
es soll eine abhängige Variable durch eine oder mehrere unabhängige Variablen erklärt werden
Beispiel von Zusammenhängen und deren korrespondierenden Pearsons-r-Werten (Korrelationscoeffizient)
Was wollen wir?
Eine Gerade berechnen, die möglichst nahe an bzw. auf den Merkmalsausprägungen liegt
diese erklärt den möglichen Zusammenhang der Variablen

Wie funktioniert das?
Wir müssen die kleinstmöglichen Abstände zwischen den Punkten und der Geraden ermitteln. (Feststellung der Vorhersagefehler)

Vorhersagefehler (Residuen)
Abstand der tatsächlichen Werte (Punkte)und der geschätzen Werte (Gerade)

1. Berechnung der einzelnen Vorhersagefehler

2. Quadrierung und Aufsummierung
der Vorhersagefehler.
Je kleiner der Vorhersagefehler,
desto genauer ist die Schätzung.

3. Signifikanztest







! Methode der kleinsten Quadrate


Lineare Regression
Multiple Regression
Quellenangabe
Skript "Methoden II: Datenauswertung", Dr. Andreas Haupt: Sommersemester 2013, Karlsruher Institut für Technologie (KIT)

ein oder mehrere Merkmale können gleichzeitig betrachtet und analysiert werden
Voraussetzungen
Mehrere Prädiktoren (UVn) beeinflussen ein Kriterium (AV)

Ziel:
die UVn sollen mithilfe einer mathematischen Regel so miteinander verrechnet werden, dass eine
möglichst gute Vorhersage
von AV erreicht wird
Beispiel:
sozialer Status
ökonomischer Status
Lebenszufriedenheit
Korrelationskoeffizient

dimensionsloses Maß für den Grad des linearen Zusammenhangs zwischen zwei mindestens intervallskalierten Merkmalen
kann Werte zwischen −1 und +1 annehmen
Bei einem Wert von +1 (bzw. −1) besteht ein vollständig positiver (bzw. negativer) linearer Zusammenhang zwischen den betrachteten Merkmalen
weist der Korrelationskoeffizient den Wert 0 auf
kein linearer Zusammenhang der beiden Merkmale
ab Minute 1:20 , r steht hier für Residuen
Vorhersagefehler
Vorhersagegleichung

ŷ = b0+b1x1+b2x2+…+bkxk

ŷ: Schätzung der AV
b0: y-Achsenabschnitt
b1,2,k: Regressionskoeffizienten
Steigung (Gewichtung)
x1,2,k: UV
b- und ß-Gewichte: inhaltliche Bedeutung
das Auffinden der Gewichte ist ein Ziel der multiplen Regressionsanalyse (ermöglicht eine präzise Vorhersage)

b-Gewicht: Um wie viele Einheiten verändert sich die Kriteriumsvorhersage (AV) wenn sich der zugehörige Prädiktor (UV) um
eine
Einheit verändert?
Abhängig von Skala: muss z-standardisiert werden

ß-Gewicht: ebenfalls, jedoch für die standardisierten Werte.
Unabhängigkeit von Skala: Vergleich des Einflusses möglich
b-Gewicht:
absolute
Information
"Welchen Prädiktor (UVn) sollte ich um 1 erhöhen, damit das Kriterium (AV) maximal steigt?"

ß-Gewicht:
relative
Information
"Mit welchem Prädiktor (UVn) erhöhe ich das Kriterium (AV) am effizientesten?"
Vorsicht!
Ebenso bei der Regressionsrechnung!

Bei der Korrelationsrechnung bedeutet Zusammenhang niemals Kausalität!
Anwendung
Beispiel für eine Multiple Regression:
(Rudolf / Müller "Multivariate Verfahren", 2012 S. 39)
(Rudolf / Müller "Multivariate Verfahren", 2012 S. 39)
Schritt 1:
Die allgemeine Gleichung
Methode der kleinsten Quadrate
(Errechnung der b- Werte)
Werte Einsetzen
Schritt 2:

n = 25; k = 9
Bestimmtheitsmaß
93% der Varianz der Kriteriumsvariablen können unter Einbezug aller Prädiktorvariablen aufgeklärt werden
Interpretation der Ergebnisse:
Die errechneten Regressionskoeffizienten ( b Werte ) eignen sich um den Zusammenhang zwischen UV und AV zu beschreiben.
Achtung
!
Die Regressionskoeffizienten sind abhängig von den jeweilgen Wertebereichen und deshalb dafür ungeeignet (Siehe Bsp. Lohn)
Multiple Regression möchte den Einfluss der einzelnen Prädiktorvariablen
innerhalb
der Regression sichtbar und vergleichbar machen.
Um diese Vergleichbarkeit garantieren zu können, werden die
Beta- Werte
berechnet
Berechnung der Beta-Gewichte
1) z- Transformation der Variablen
2) Methode der kleinsten Quadrate
- Variablen werden vergleichbar -
Vielfalt
und
Ehrgeiz
haben den größten Einfluss
Redundanz von Prädiktoren
signifikante Korrelation zwischen Ehrgeiz und Motivation sowie Leistungsstreben und Motivation
Nur Ehrgeiz besitzt einen signifikanten Wert auf das Kriterium
Grund: Multikollinearität
Multikollinearität
- Trotz hoher Korrelation zwischen Leistungsstreben und Motivation, hat es einen Beta Wert von gerade mal .002. Ehrgeiz ist durch seinen hohen Beta Wert ( .69) besser für die Vorhersagen des Kriteriums geeignet.

- Kommt eine dritte Variable dazu ( hier Kreativität) wird durch die Methode der kleinsten Quadrate berechnet, welche der beiden Variablen Ehrgeiz und Leistungsstreben besser mit der dritten Variable zur Vorhersage des Kriteriums geeignet ist.

Rudolf, Matthias; Müller Johannes; "Multivariate Verfahren, 2., überarbeitete und erweitere Auflage" 2012




UV: Einkommen der Eltern
AV:
Schulnoten der Kinder
Beispiel
Video lineare Regression: www.youtube.com/watch?v=S2-xds1dvS8
Video multiple Regression: www.youtube.com/watch?v=uBRXqlZr11I
Backhaus; "Multivariate Analysemethoden: eine anwendungsorientierte Einführung" 2008
(Rudolf / Müller "Multivariate Verfahren", 2012)
(Rudolf / Müller "Multivariate Verfahren", 2012)
(Rudolf / Müller "Multivariate Verfahren", 2012)
Full transcript