Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Regressie

No description
by

yves Dejaeghere

on 28 February 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Regressie

gemiddelde inkomen van iemand
die vijf jaar een masterdiploma KUL wetenschappen op zak heeft? Gemiddeld: 1700 euro
standaarddiviatie: 250 euro Regressie laat toe de invloed van verschillende elementen op een bepaalde variabele (waarde) tesamen te onderzoeken. Welke kenmerken zouden je toelaten je gok te verbeteren? -afstudeerrichting
-gemiddelde score in laatste jaar
-werkt in publieke of private sector
-geslacht
-ambitie
-ancienniteit
-... Met regressie kan je dit onderzoeken. Bovendien controleer je voor de verschillende variabelen in het model. Dit wil bv. zeggen dat als geslacht geen resultaat geeft in je model ondanks het feit dat vrouwen in je ruwe data duidelijk minder verdienen dit ligt aan een andere parameter die wel bepalend is en waar vrouwen anders op scoren (vb. ambitie / opleiding) R²? Geeft aan hoeveel van de totale spreiding je model kan verklaren.
100% = angstwekkend
1% = belasting over de balk Wat betekent dat als het zeer laag is?
-meetfouten (minder bij exacte)
-er zijn variabelen die je over het hoofd hebt gezien
-mensen zijn vervelend... ***, **, *
Kans dat dit 'toevalstreffer' is
-belangrijkste uitgangspunt dan is dat er GEEN verband is.
vb. p=0.01 Statistisch significant IS NIET per sé betekenisvol Problemen... niet-lineair... je verklarende eigenschappern hangen
zeer hard samen (multicollineariteit) de spreiding rond je lijn
is niet overal hetzelfde (heteroscedasticitei) interactie-effect... al je relevante variabelen
moeten in het model zitten...daarom
is peer-review belangrijk Tweede soort regressie = logistische
probleem: de variabele die je wil verklaren is gewoon 'ja' of 'neen'...vb. tekent petitie / is zwanger / wordt minister / auto-ongeluk -principe blijft ongeveer hetzelfde (technische bewerkingen zijn dramatisch anders, maar niet iedere chauffeur wil garagist zijn...) -de parameter voorspelt nu 'verandering in de kans dat...'
-de parameter exp(b) 1,6 leest als 'een stijging in één eenheid blabla doet je kans stijgen met 1,6 ongeacht je waarde op de andere paremeters.'
-bijvoorbeeld exp(b): 2,1 voor pintjes op auto-ongelukken => ieder pintje verdubbelt je kans op een ongeluk. Maar niet lineair: als je beginkans 1 op 1000 is wordt dat 2,4,8,16,32,64...dus als je echt de exacte kans wil weten moet je echt berekenen, maar dat is vaak niet het belangrijkste...we willen vooral onthouden dat je kans verdubbelt...
Full transcript