# college 2 statistiek

centrum en spreidingsmaten
by

## jan mullenberg

on 9 September 2014

#### Transcript of college 2 statistiek

Descriptive Statistics
used for analysing, organising and summarising results
MEASURES OF CENTRAL TENDENCY
mean
the arithmetic 'average' of scores
calculated by adding a group of scores then dividing by the number of scores
the mean is sensitive to high or low scores
the middle score in the group of scores
arrange the scores from highest to lowest
then select the score that falls "in the middle"
Mode
the most frequently occuring score in a group of scores
is easy to obtain
Graphical statistics
graphs
a pictorial representation of the results
and the libor rate
London Interbank Offered Rate
median
mode
Bank of America,
Bank of Tokyo,
Barclays Bank,
BNP Paribas,
Citibank,
Credit Agricole,
Credit Suisse,
Deutsche Bank,
JP Morgan Chase,
Lloyds Banking Group,
Royal Bank of Scotland,
Rabobank
0,23
0,20
0,26
0,20
0,29
0,19
0,21
0,21
0.18
0,23
0,17
0,20

2,57

12
0,2141
mean 0,279
X1
n
= mean
n+1 / 2= 11+1/2= 6e waarneming
nominal
analyze, descriptive statistics, frequenties,drag variable, graph, .........
histogram
barchart
piechart
statistiek college 2
leren: hoofdstuk 1
thuisoprachten college 2
a:75% of all murder victims knew their killer.
b:95% of the creatures on earth are smaller than a chicken egg.
c:The average sleeper rolls over 12 times in bed per night.
d:Women are twice more talkative than men! It has been estimated that on average, men speak 12,500 words and women speak about 25,500 words in a day.
onderzoeksobject
variabel
uitkomst
wel bezit
geen bezit
onderzoeksobjecten
alle klanten op betreffende dag
variabelen
geslacht

leeftijd

besteed bedrag
waarden
man
vrouw
0-100
bedrag in euro's 0 > 0 euro
uitkomst
kwalitatieve variabelen
Categorische variabelen
Met de waarden van categorische variabelen kan niet gerekend worden
kwantatieve variabelen
variabelen
kwalitatief
kwantitatief
discreet
continue
nominaal
ordinaal
interval
ratio
meetniveaus
verschil meer in soort dan in sterkte , gender, nationality, etc.
het aantal belminuten,
tips & tricks vragenlijstconstructie
hoeveel geld zou u maximaal uit willen geven aan de iphone 5? ..........................................
(open antwoord)

hoeveel geld zou u maximaal uit willen geven aan de iphone 5?
a: 0-100
b:101-250
c:251-300
d:301-450
e:451-500
f: meer dan 500

naar schatting moet 86 procent van de soorten op het land en 91 procent van de soorten in het water nog worden ontdekt
opdracht 1:
spss
U= 3
tevredenheid op schaal van 1-5
1
3
3
5
3
2
4
4
2
1
2
3
1
4
4
2
4
1 2 3 4 5
o
o
o
o
o
std uitrekenen in een notendop
1
4
3
2
8
6
1 2 3 4 5 6 7 8
o
o
o
o
o
o
2
gemiddelde
-2
-2
-2
=-1
= 0
= 1
2
2
2
= 1
= 0
= 1
2
n-1
2
n-1
variantie
standaarddeviatie
median
spreidingsmaten
std: 1.41
std: 2.60
kleine spreiding
spreiding al wat grotere
ruwe score
-
gemiddelde
=
dit tel je bij elkaar op
dat deel je weer door n-1
en laatste de wortel daarvan
steekproefdistributie
slimme wiskundige hebben gevonden dat waneer een steekproef groot genoeg (30 en meer) is, je een normale distributie krijgt
centrale limiet stelling
Lindeberg-Levy
kleine steekproeven.... minder dan 30 respondenten een andere verdelingsvorm (t verdeling)
gem= 100
std=15
wat wil men maximaal betalen voor de samsung tablet
mean= 700 euro
std= 150 euro
je bereikt 68,2 procent van de markt, waneer je met je marktprijs tussen de 550 en 850 gaat zitten
700
850
550
mean= 500 euro
std= 120 euro
je bereikt 95,4 procent van de markt, waneer je met je marktprijs tussen de ...... en ..... gaat zitten
college 3 het betrouwbaarheidsinterval
leren: hoofdstuk 2.1 tm 2.5.2
thuisopdrachten college 3
A: Een goede methode om een schatting te maken van je populatie gemiddelde is het
schatting van grenzen, waarin we denken dat het populatie gemiddelde zal vallen.
betrouwbaarheidsinterval
95 % betrowbaarheidsinterval
als we 100 steekproeven zouden houden, bereken daarvan het gemiddelde en boven en ondergrens. dan zullen 95 van de 100 steekproeven het ware populatie gemiddelde raken
kleine std
grote std
wat wilt men maximaal betalen voor de samsung hoes?
Het interval waarbinnen met 95% waarschijnlijkheid de werkelijke waarde in de populatie zal vallen
oftewel
hoe bepaal je nu zo'n betrouwbaarheidsinterval???
Descriptive Statistics
N Min Max Mean Std. Deviation
tevredenheid over de ondersteuning samsung helpdesk 45 2,00 10,00 5,0444 1,97663
5.044
5,04 + (1,96 x
1,976 / wortel van 45)
6,70
95% Confidence Interval for Mean Lower Bound 3,3534
Upper Bound 14,4244

Mean 8,8889
Std. Deviation 7,20147
N= 9

8,8889 + t*
3
7,20147
2.40049 = 14,42
8,8889 + 2.306*
+ t* (std/wortel n)
upperbound=
lowerbound=
- t* ( std/wortel n)
8,8889 - 2.306*
2.40049 = 3,35
Mean 8,8889
Std. Deviation 7,20147
N= 9

95% Confidence Interval for Mean Lower Bound 4,4137
Upper Bound 5,4863

Std. Deviation 1,14593

Mean 4,9500
