The Internet belongs to everyone. Let’s keep it that way.

Protect Net Neutrality
Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Statistiek 2017 volgens cyclus

No description
by

Hester Vogels

on 12 September 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Statistiek 2017 volgens cyclus

.
50 60 70 80
.
.
.
.
.
.
62,4 62,5 62,6 62,7 62,8 62,9
Is het wel representatief?
De steekproef is voldoende groot
De steekproef is aselect
Populatieproportie
Steekproefproportie
Proportie vegetariërs in Nederland
Van de 16,9 miljoen Nederlanders zijn ...
?
vegetariër.
In een steekproef van 1000 Nederlanders zijn 48 vegetariër.
Kwalitatieve variabelen
Nominaal
Ordinaal
Categorieën zonder volgorde
Categorieën met een volgorde
Voorbeelden
blauw / groen / bruin
Voorbeelden
nooit/soms/vaak/altijd
Beelddiagram
Aantal Nederlandse gebruikers sociale media
facebook
twitter
linkedIn
instagram
pinterest
= 1 miljoen
Steel-bladdiagram
Aantal minuten op whatsapp per dag
man
vrouw
0
1
2
3
4
5
tientallen
5 8 9
3 7 7 8
5 8 9 9
0 1 2 5 6
4 4 7
9
6 3 3
9 7 7 5 1
4 2 1
9 8
6 6 3 1
7 2 0
eenheden
eenheden
man / vrouw
1 / 2 / 3 / 4 / 5 sterren
Verdelingen
Soorten verdelingen
Symmetrisch
Het effect van uitschieters
Cijfer
Frequentie
4 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 9 9 10 10
1 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 9 9 10 10
Modus
Mediaan
Gemiddelde
Spreidingsbreedte
Gemiddelde, modus en mediaan
De normale verdeling
68%
95%
Frequentie
2,5%
Normaal-waarschijnlijkheidspapier geen CE-stof!
Bij een onderzoek naar het gebruik van sociale media zijn 326 meisjes tussen de 11 en 19 jaar ondervraagd. Hiervan blijken er 197 gebruik te maken van Instagram.
Wat zegt dit over het gedeelte Instagram-gebruikers bij 11 tot 19-jarige meisjes in Nederland?
Bepaal het 95%-betrouwbaarheidsinterval.
Het 95%-betrouwbaarheidsinterval is
De standaardafwijking van een steekproefproportie is
Dus het 95%-betrouwbaarheidsinterval is:
Voorbeeld
Betrouwbaarheidsinterval voor populatieproportie
Steekproefomvang
Er wordt een onderzoek gedaan naar de proportie smartphone-bezitters in Nederland. De opdrachtgever wil dat het 95%-betrouwbaarheidsinterval maximaal 0,04 breed is.
Er wordt uitgegaan van een populatieproportie van 0,8.
Hoeveel mensen moeten de onderzoekers minimaal ondervragen?
Met je GR of met de hand:
Voorbeeld proportie
Onderzoeksvraag
Data verzamelen
Data analyseren
Conclusies trekken
Statistiek
Soorten variabelen
Groepen vergelijken
Kwantitatieve variabelen
Max. Vcp
Gemiddelde
Standaardafwijking
Voorbeeld 1
De score op een IQ-test is normaal verdeeld met een gemiddelde van 100 en een standaardafwijking van 15. Hoeveel procent heeft een IQ van meer dan 130?
100
Dus 2,5%
Voorbeeld 2
Het gewicht van een pak De Ruijter hagelslag is normaal verdeeld met een gemiddelde van 500 gram. Er is bekend dat 16% van de pakken meer dan 502 gram weegt. Bereken de standaardafwijking.
16% ligt boven
Dus de standaardafwijking is 2 gram.
Het 95%-betrouwbaarheidsinterval is
De standaardafwijking van een steekproefproportie is
1.
Er is statistische samenhang tussen de variabelen.
2.
De variabele die als veroorzakende variabele wordt beschouwd, moet in de tijd voorafgaan aan de andere variabele.
3.
Er moeten geen andere variabelen in het spel zijn die het verband veroorzaken.
Het aantal uur trainen voor een hardloopwedstrijd
De eindtijd bij de hardloopwedstrijd
Het aantal verkochte ijsjes in een week
Het aantal verdrinkings-gevallen in een week
Warm weer
Normaalkromme
Discreet
Continu
Losse getallen
Ook tussenliggende getallen
Proportie/gemiddelde schatten
Groepen vergelijken
Samenhang onderzoeken
"Welk deel van de 18-jarige kiezers zou nu PVV stemmen?"
"Wat is het gemiddelde aantal uur dat een 17-jarige op zijn/haar telefoon kijkt per dag?"
"Is het gemiddelde cijfer van jongens bij centrale examens hoger dan dat van meisjes?"
"Slapen pubers langer dan volwassenen?"
"Is er een verband tussen het eten van superfood en levensverwachting?"
"Speelt de leeftijd van een docent een rol bij de kwaliteit van de lessen?"
Populatie
Steekproef
Databestand
Getallen
Categorieën
of
Phi-coëfficiënt
Kwalitatieve variabelen
Samenhang onderzoeken
Spreidingsdiagram & trendlijn
Kwantitatieve variabelen
Onderzoekscyclus
25%
Merk A


Merk B


Merk C
Laadtijd accu smartphones
Van elk merk zijn er 1000 smartphones getest die tussen 1 en 3 jaar in gebruik zijn.
250 smartphones van merk A hadden een laadtijd van meer dan 112 minuten
80
minuten
Kwantitatieve variabelen
Effectgrootte
Nominaal
Ordinaal
Percentageverschil en odds-ratio geen CE stof!
phi =
diagonaal 1 - diagonaal 2
wortel van totalen maal elkaar
.
.
.
.
.
0
0,2
0,4
-0,2
-0,4
Gering
Middelmatig
Middelmatig
Groot
Groot
Gering
Bepaal cumulatieve percentages bij beide groepen
Max. Vcp is het grootste verschil tussen de twee groepen
.
.
.
40%
20%
0%
Gering
Middelmatig
Groot
100%
.
Effectgrootte

=
(standaardafwijking 1 + standaardafwijking 2)
.
.
.
0,8
0,4
0
Gering
Middelmatig
Groot
Boxplots vergelijken
.
.
.
.
.
.
of
of...
Kaartdiagram
Stroomdiagram
(Puntenwolk)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
Schoenmaat
Lengte
Interval en Ratio geen CE-stof!
Ordinaal
Leeftijd in klassen
Vriendencontact
Opleiding
Nominaal
Geslacht
Etniciteit
Kwantitatief
Aantal uur TV kijken p/w
Aantal uur sport p/w
Tabellen
Diagrammen
Kentallen
Kruistabel
Frequentietabel
Geeft aan hoe vaak elke waarde voorkomt
Absoluut
Relatief
(Absoluut)
cumulatief
Relatief cumulatief
Klassenindeling
20 telt wel mee, 25 niet
Alle klassen zijn even breed
Kwantitatieve variabele wordt ordinaal weergegeven
Geeft globaal inzicht in samenhang tussen variabelen
Absoluut
Relatief
Rij-percentage
Kolom-percentage
Totaal-percentage
Van de respondenten die HBO of universiteit hebben afgerond, is 51,1% man
29,8% van de mannelijke respondenten heeft HBO of universiteit afgerond
14,3% van de respondenten heeft HBO of universiteit afgerond én is man
Drie variabelen
Geslacht
Opleiding
Kolommen gesplitst op etniciteit
Dotplot
Staafdiagram
Cirkeldiagram
Frequentiepolygoon
Boxplot
Spreidingsdiagram
Selectie
Man
20 tot 24 jaar
HBO of universiteit
Aantal uur sporten per week
Gesplitst op etniciteit
Stapeldiagram
Twee variabelen
Opleiding
Gesplitst op geslacht
Uitschieters kun je goed zien
Handig voor kleine aantallen
Geeft individuele data weer
Relatief
Geeft met staven de frequenties weer
Handig voor grote aantallen
Opleidingsniveau
1 of 2
2 of 3
1 of 2
Twee variabelen
Gesplitst op geslacht
Twee variabelen
1 of 2
1
1
2
1
Lijndiagram
Relatief
Cumulatief
Relatief en cumulatief
Aantal uur tv kijken
Geeft met cirkelsegmenten de frequenties weer
Meest geschikt wanneer de verschillende categorieën sterk in grootte verschillen
Geeft met punten de frequenties weer
Handig voor grote aantallen
Uitschieters zijn niet goed te zien
De verdeling van data is goed te zien
Kwantitatieve variabelen
Kwalitatieve variabelen
Histogram
Selectie
Man
20 tot 24 jaar
HBO of universiteit
Aantal uur sporten per week
Stapeldiagram
Geeft met staven de frequenties weer
Handig voor grote aantallen
Uitschieters zijn niet goed te zien
De verdeling van data is goed te zien
Gesplitst op etniciteit
Twee variabelen
1 of 2
1
Meest geschikt wanneer de verschillende categorieën weinig in grootte verschillen
Handig voor grote aantallen
1 en tijd
Geeft de ontwikkeling van een variabele in de tijd weer
Geschikt als tijd een variabele is
Geeft met figuurtjes de frequenties weer
Speelse vorm van staafdiagram
Infographic
Informatieve illustratie van verschillende objecten met een combinatie van tekst en beeld
Zelf één maken:
www.piktochart.com
1 en plaats
Geeft de categorie per plaats aan
Geschikt als plaats een variabele is
Leefbaarheid
Voorzieningen, economie, natuur, rust en ruimte, harmonieus leefklimaat en bereikbaarheid
Stromen in het Nederlandse onderwijs in 2012
(Volkskrant, 2014)
Geeft een schematische voorstelling van een proces of stroom
Geeft individuele data weer
Uitschieters kun je goed zien
Handig voor kleine aantallen
Aantal minuten op whatsapp per dag
0
1
2
3
4
5
tientallen
3 3 5 6 8 9
1 3 5 7 7 7 7 8 9
1 2 4 5 8 9 9
0 1 2 5 6 8 9
1 3 4 4 6 6 7
0 2 7 9
eenheden
1 of 2
Gesplitst op geslacht
Twee variabelen
Dubbel steel-bladdiagram
Geeft de spreiding van data weer
Geeft de samenhang tussen twee variabelen weer
12,5% van de respondenten heeft vaker dan 1 keer per maand contact met vrienden
63478 respondenten hebben minstens 1 keer per week of vaker dan 1 keer per maand contact met vrienden
7,8% van de respondenten sport tussen de 10 en 15 uur per week
96,5% van de respondenten sport minder dan 20 uur per week
9484 vrouwelijke respondenten hebben HBO of universiteit gedaan
12450 mannelijke respondenten hebben havo, vwo of mbo afgerond
25%
25%
25%
Minimum
Q1
Q3
Mediaan
Maximum
90
100
110
120
130
80
minuten
90
100
110
120
130
80
minuten
90
100
110
120
130
45
43
41
39
37
35
1.50
1.60
1.70
1.80
1.90
2.00
514 mannelijke respondenten met een migratieachtergrond hebben LBO afgerond
6389 respondenten hebben lager onderwijs of anders afgerond
28,0% van de respondenten heeft HBO of universiteit afgerond
Ongeveer 24900 respondenten hebben havo, vwo of MBO afgerond en ongeveer de helft daarvan is vrouw
12450 mannelijke respondenten en 12409 vrouwelijke respondenten hebben havo, vwo of MBO afgerond
38,85% (de meerderheid) van de respondenten heeft havo, vwo of MBO afgerond
Bijna 4 miljoen Nederlanders maken gebruik van LinkedIn
In 1968 waren op Schiphol 4 miljoen passagiers
De populariteit van Hyves is vanaf 2009 flink afgenomen
Volgens het oordeel van Elsevier is de leefbaarheid in de gemeente Almere matig
15% van de beginhoeveelheid maakt een overstap van MBO naar HBO
De populairste thema's in infographics zijn business, health en politics
Eén mannelijke respondent, die tussen de 20 en 24 jaar is en HBO of universiteit heeft afgerond, sport 50 uur per week
Drie mannelijke respondenten met een Nederlandse achtergrond, die tussen de 20 en 24 jaar zijn en HBO of universiteit hebben afgerond, sporten 15 uur per week
Elf mannelijke respondenten, die tussen de 20 en 24 jaar zijn en HBO of universiteit hebben afgerond, sporten tussen de 18 en 21 uur per week
27,8% van de mannelijke respondenten, die tussen de 20 en 24 jaar zijn en HBO of universiteit hebben afgerond, sporten tussen de 0 en 3 uur per week
Ruim 40 mannelijke respondenten, die tussen de 20 en 24 jaar zijn en HBO of universiteit hebben afgerond, sporten tussen de 10 en 15 uur per week;
de meerderheid heeft een Nederlandse achtergrond
43 mannelijke respondenten, die tussen de 20 en 24 jaar zijn en HBO of universiteit hebben afgerond, sporten tussen de 10 en 15 uur per week;
daarvan hebben 33 een Nederlandse achtergrond
Ongeveer 24400 respondenten kijken tussen de 10 en 20 uur tv per week.
Ongeveer 35% van de respondenten kijkt tussen de 10 en 20 uur tv per week.
Ongeveer 45000 respondenten kijken minder dan 20 uur tv per week.
Ongeveer twee derde van de respondenten kijkt minder dan 20 uur tv per week.
Twee respondenten zitten 3 minuten op whatsapp per dag
Drie mannelijke en één vrouwelijke respondent zitten 50 minuten of meer op whatsapp per dag
Merk C is het minst betrouwbaar
Er lijkt statistische samenhang te bestaan tussen lengte en schoenmaat
Er lijkt geen statistische samenhang te bestaan tussen aantal uur tv kijken per week en aantal uur sporten per week
Tweetoppig
Rechts-scheef
Links-scheef
Uniform
Frequentie
Frequentie
Frequentie
Frequentie
Gemiddelde
Mediaan
Modus
Gemiddelde en mediaan
Gemiddelde
Mediaan
Modus
Gemiddelde
Mediaan
Modus
13,5%
34%
2,5%
13,5%
34%
115
130
500
502
Centrummaten
Gemiddelde
Modus
Mediaan
Het evenwichtspunt van de verdeling
De meest voorkomende waarde
De middelste waarde
X
De respondenten sporten gemiddeld 4,6 uur per week
De helft van de respondenten sport minder dan 3 uur per week, de andere helft sport meer dan 3 uur per week
Het antwoord '0 uur sporten' is het meest voorkomend
Voorbeeld
Spreidingsmaten
Spreidingsbreedte
Interkwartielafstand
Standaardafwijking
Maximum - minimum
Q3 - Q1
De gemiddelde afwijking van het gemiddelde
De spreidingsbreedte is 50
De standaardafwijking is 5,96
Voorbeeld
Voor alles geldt: hoe groter, hoe meer spreiding in de data
Gevoelig voor uitschieters
Gevoelig voor uitschieters
25%
25%
25%
25%
Minimum
Q1
Q3
Mediaan
Maximum
Cijfer
Frequentie
?
?
1
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
Schoenmaat
Lengte
45
43
41
39
37
35
1.50
1.60
1.70
1.80
1.90
2.00
Bij een onderzoek van de GGD is aan 547 leerlingen uit 5 havo gevraagd hoeveel uur zij sporten in een week. Het gemiddelde was 3,2 uur met een standaardafwijking van 1,1.
Bepaal het 95%-betrouwbaarheidsinterval voor het gemiddelde aantal uur dat 5 havo leerlingen sporten.
Het 95%-betrouwbaarheidsinterval is
Voorbeeld
Voorbeeld
iPhone
Android
Scherm gebroken
Ja
Nee
Dus het 95%-betrouwbaarheidsinterval is:
47
28
235
366
282
394
75
601
676
Omdat
is het verschil gering.
Voorbeeld
Het verschil in cumulatieve percentages is:
10,05 - 8,31 = 1,74%
24,05 - 21,16 = 2,89%
39,28 - 32,77 = 6,51%
73,70 - 70,18 = 3,52%
100 - 100 = 0%
Dus het maximaal verschil in cumulatieve percentages is 6,51%.
Dat is kleiner dan 20%, dus het verschil is gering.
Aan 676 iPhone- en Android-gebruikers is gevraagd of het scherm van hun huidige telefoon wel eens gebroken is. In onderstaande tabel staan de resultaten. Onderzoek het verschil tussen iPhone- en Android-gebruikers.
Onderzoek het verschil tussen mannen en vrouwen wat betreft opleidingsniveau.
gemiddelde 1 - gemiddelde 2
Voorbeeld
Klas A
Klas B
Cijfer statistiek toets
Gemiddelde
6,0
1,3
6,9
2,2
In twee 5 havo wiskunde A klassen is dezelfde statistiek toets afgenomen. De resultaten staan in de onderstaande tabel.

Onderzoek het verschil tussen klas A en klas B.
Standaardafwijking
Omdat
is het verschil middelmatig.
Voorbeeld
Onderzoek het verschil tussen mannen en vrouwen wat betreft het aantal uur tv kijken per week.
Het verschil is groot.
Het verschil is middelmatig.
Het verschil is gering.
Het eten van chocolade leidt tot een Nobel prijs?!
Hoeveel procent van Nederland stemt op de PVV?
"Op welke partij gaat u stemmen?"
"Er gaat maar 8% van de mensen op de PVV stemmen!"
"Jongens verslapen zich vaker dan meisjes."
Als data gebruiken de onderzoekers het aantal te-laat meldingen op een school.
Er blijkt een groot verschil te zijn in het aantal te-laat meldingen bij jongens en meisjes, waarbij jongens vaker te laat komen dan meisjes. De onderzoekers concluderen:
Is dat wat er gemeten is?
Bron: De Correspondent
Proportie/gemiddelde schatten
Populatieproportie
Populatiegemiddelde
Is de juiste onderzoeksvraag gesteld?
Is de juiste data verzameld?
Was de steekproef aselect?
Was de steekproef voldoende groot?
Is de data juist geanalyseerd?
Worden de resultaten zonder misleidingen gepresenteerd?
Is er sprake van een oorzakelijk verband?
Kwalitatieve variabelen
Voorbeeld
Kruistabel
Rij-percentage
Kolom-percentage
Is er een verband tussen geslacht en opleidingsniveau?
Bij de hogere opleidingsniveaus (havo of hoger) zijn de mannen in de meerderheid, bij de lagere opleidingsniveaus zijn de vrouwen in de meerderheid. (Maar het scheelt weinig.)
29,82% van de mannen heeft HBO of universiteit afgerond, tegenover 26,30% van de vrouwen.
Mannen zijn hoger opgeleid dan vrouwen.
Voorbeeld
Betrouwbaarheidsinterval voor populatiegemiddelde
Populatiegemiddelde
Steekproefgemiddelde
Gemiddeld aantal minuten op Instagram per dag
Gebruikers maken gemiddeld ...
?
minuten per dag gebruik van Instagram.
Voor een steekproef van 1000 gebruikers geldt:
Kun je dat concluderen?
.
Stel de formule van de trendlijn op.
(1.70 ; 39)
(2.00 ; 47)
Iemand met lengte 1.83 heeft naar verwachting schoenmaat 42.5.
Is er een verband tussen lengte en schoenmaat?
Een onderzoek heeft als vraag: "Verslapen jongens zich vaker dan meisjes?"
Wat zijn de oorzaken van overmatig drugsgebruik onder jongeren in Utrecht en hoe kan overmatig drugsgebruik worden tegen gegaan?
Hoe kan overmatig drugsgebruik onder jongeren in Utrecht worden tegengegaan?
Wat zijn de oorzaken van overmatig drugsgebruik onder jongeren in Utrecht?
Deelvraag:
Wat was het slagingspercentage van havisten in 2016?
Is er samenhang tussen de examenresultaten voor wiskunde en de resultaten van de rekentoets bij havisten?
Wat kunnen televisiemakers doen om meer jonge kijkers te trekken?
Voorkom een dubbele onderzoeksvraag
Stel een open vraag
Wees specifiek
Hoe kan RTL Late Night gebruik maken van sociale media om de doelgroep in de leeftijdscategorie 18-24 te bereiken?
Bij een onderzoek naar het soort vervoer naar school op een school met 1800 leerlingen, worden 20 leerlingen ondervraagd. Twee leerlingen blijken met het OV te naar school te gaan.
"Tien procent van de leerlingen gebruikt het OV om op school te komen."
Er wordt geconcludeerd:
Was deze steekproef voldoende groot?
Wat als er 50 leerlingen waren ondervraagd? Of 100?
Zie bepalen steekproefomvang bij betrouwbaarheidsintervallen.
Er wordt onderzoek gedaan naar het verschil tussen jongens en meisjes in de mate van plezier waarmee ze naar school gaan.
De stelling in de enquête luidde:
"Ik vind het leuk om naar school te gaan."
Helemaal oneens
Oneens
Neutraal
Eens
Helemaal eens
1
2
3
4
5
In de dataset worden deze weergegeven met cijfers.
De antwoord mogelijkheden waren:
De onderzoeker bepaalt nu de effectgrootte.
Wat gaat hier mis?
De variabele niet kwantitatief, dus de effectgrootte kan niet worden gebruikt.
De variabele is ordinaal, dus bijvoorbeeld max. VCP had gebruikt kunnen worden.
Bron: peilingpraktijken.nl
Bron: tweet @JerryVermanen
De y-as begint niet bij nul!
De staven worden steeds breder...
... en een deel van de partijen is weggelaten!
Wanneer is er sprake van een oorzakelijk verband?
Voorbeelden
Nooit
Soms
Vaak
Altijd
Kwantitatieve variabelen
Data beschrijven
Kwalitatieve variabelen
Kwantitatieve variabelen met klassenindeling
Standaardafwijking
Interkwartielafstand
Gevoelig voor uitschieters
Er wordt een onderzoek gedaan naar de gemiddelde kosten van het telefoonabonnement van Nederlanders. De opdrachtgever wil dat het 95%-betrouwbaarheidsinterval maximaal 6 breed is.
Er wordt uitgegaan van een steekproefstandaardafwijking van 9.
Hoeveel mensen moeten de onderzoekers minimaal ondervragen?
Voorbeeld gemiddelde
Het 95%-betrouwbaarheidsinterval is
Met je GR of met de hand:
De onderzoekers moeten minimaal 1600 mensen ondervragen.
De onderzoekers moeten minimaal 36 mensen ondervragen.
Welke schoenmaat heeft iemand met lengte 1.83 naar verwachting?
Full transcript