Loading presentation...
Prezi is an interactive zooming presentation

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Statistiek

Inleiding Statistiek voor project "Waterzuivering", Bachelor Agro- en Biotechnologie, Thomas More Kempen, Geel
by

Rob Van Deun

on 14 March 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Statistiek

Statistiek
De voorbeelden in deze presentatie zijn fictieve, verzonnen voorbeelden.
De getallen zijn niet afkomstig van het onderzoek uitgevoerd aan Thomas More Kempen.

De bedoeling is de statistische methoden te illustreren.
Dit is geen presentatie over de mogelijkheden van rietvelden!

(Rob Van Deun, Thomas More Kempen)

Beschrijvende statistiek
Gegevensanalyse
Parametrisch
Niet-Parametrisch
Populatie
Steekproef
Eenvoudige manier om iets te vertellen over een grote hoeveelheid gegevens.
Zoeken naar een verband tussen gegevens;
Testen van hypothesen: “Is er een significant verschil of niet?”
Normaal verdeeld
Niet-mormaal verdeeld
Beschrijvende statistiek
Gegevensanalyse
Gemiddelde
Mediaan
Standaardafwijking
Variantie
Spreidingsbreedte
Aantal
Outliers - Z-scores
Correlatie
Correlatiecoëfficiënt
Determinatiecoëfficiënt
T-toetsen
T-toets: twee gepaarde steekproeven voor gemiddelden
T-toets: twee gepaarde steekproeven met gelijke varianties
T-toets: twee steekproeven met ongelijke varianties
Variantieanalyse ANOVA
Unifactoriële variantie-analyse
Multifactoriële variantie-analyse
Unifactoriële variantie-analyse met herhaalde metingen
Multifactoriële variantie-analyse met herhaalde metingen
Volledige populatie: =STDEV.P(A1:A8) =VAR.P(A1:A8)

Steekproef: =STDEV.S(A1:A8) =VAR.S(A1:A8)
Parametrische test: de verzamelde gegevens zijn “normaal” verdeeld.
Niet-Parametrische test: de verzamelde gegevens volgen geen normaalverdeling.
Oplossingen:
Andere formules gebruiken (bij gegevensanalyse);
Gegevens “transformeren” = veranderen (bij gegevensanalyse).
Praktisch:
n>100: geen probleem, altijd parametrisch
n<6: altijd niet-parametrisch

Je kan normaal parametrische tests gebruiken indien n>24


EXCEL: ALLEEN PARAMETRISCHE STATISTIEK
Niet-parametrisch: OriginLab, SPSS,...
Software:

Office Excel 2010: Formules + Gegevensanalyse
Gegevensanalyse: Installeren via “Help”, “Opties”, “Invoegtoepassingen”, “Analysis Toolpak”

Graphpad Prism (downloaden via web-
site).

OriginPro 8.5 (Het is ten strengste verboden OriginLab.OriginPro.v8.0.SR1, bv. via torrent-software te downloaden.)
Correlatie:
gegevensverzamelingen (data)
T-test, ANOVA:
factor(en)
gegevensverzamelingen (data)
(+ subject)
Data, Correlatie
"Raw"
"Indexed"
Factor
Data
ANOVA
Is er een verband tussen gegevensverzamelingen?
Heeft één gegevensverzameling een effect op een andere gegevensverzameling?
Is dat effect positief?
Is dat effect negatief?

Correlatiecoëfficiënt “r”
Getal tussen -1 en 1

Parametrisch: correlatiecoëfficiënt volgens Pearson
Niet-Parametrisch: correlatiecoëfficiënt volgens Spearman
Correlatie
Interpretatie correlatiecoëff. “r”
tussen -0,3 en 0,3: geen correlatie
tussen -0,3 en -0,7 of 0,3 en 0,7: beetje correlatie (neg. of pos.)
tussen -0,7 en -1 of 0,7 en 1: goede correlatie (neg. of pos.)
“Two-tailed versus One-tailed”

Ingewikkeld !!!!!
“One-tailed” : zoekt naar een positieve of een negatieve correlatie;
“Two-tailed” : zoekt naar een correlatie;
Standaard neemt men gewoonlijk steeds de “two-tailed” correlatie.

Nl.: Eénzijdig-Tweezijdig
Determinatiecoëfficiënt r
2
Stel = 0,6052
Dit betekent dat 60,52% van de variatie in de data in de ene gegevensreeks kan verklaard worden door de waarden van de data uit de andere gegevensreeks. Maar dus 39,48% kan NIET verklaard worden.
r
2
T-test
alleen geschikt voor 1 of 2 groepen
Is er wel of is er geen significant verschil tussen de groepen.
In EXCEL:
T-toets: twee gepaarde steekproeven voor gemiddelden
:
Typisch voor een “voor en na” experiment.
Beoordelen T-test en ANOVA
“Alfa” of is betrouwbaarheid.
Normaal ingesteld op 0,05, dus een betrouwbaarheid van 95%.

We moeten minstens een zekerheid hebben van 95% dat een resultaat niet aan toeval te wijten is, om dat resultaat te kunnen aanvaarden.

p-waarde = 0,1 dus zekerheid van 90% dat effect of verschil geen toeval is. 90% zekerheid is onvoldoende, we willen 95% zekerheid.
p-waarde = 0,049 dus zekerheid van 95,1% dat effect of verschil geen toeval is. Dus er is een significant verschil, verschil of effcct kan geen toeval zijn.
Variantie-analyse ANOVA
Factor en data
Factor waarvan de significantie of invloed gecontroleerd wordt.
Bv. soort planten, soort substraat, soort verontreiniging, soort behandeling,…..
Unifactorieel: slechts één factor wordt gecontroleerd.
Bv. soort planten
Multifactorieel: twee (of meer) factoren worden gecontroleerd.
Bv. soort planten en soort substraat...

Data: de gegevens, de metingen, de getallen die we gebruiken om de significantie of invloed van de factor(en) te beoordelen.
Bv. percentages, zuiveringsrendementen, tellingen, scores,….
Voorbeelden ANOVA
Unifactoriële ANOVA:
"Is er een significant verschil in het percentage ammonium-verwijdering bij de verschillende systemen, verschillende planten, onbeplant?"
Multifactoriële ANOVA:
"Is er een significant verschil in CZV-verwijdering op rietvelden beplant met riet op zand of met riet op grind of met lisdodde op zand of met lisdodde op grind?"
Unifactoriële ANOVA:
p<0,05 dus er is een significant verschil, maar waar zit het verschil?
Verschillende ANOVA’s op 2 groepen uitvoeren;
Een
post hoc test
uitvoeren, bv. een
Tukey-test
, niet mogelijk met Excel, wel met Prism, OriginPro of SPSS.
ANOVA met herhaalde metingen
"Is er een significant verschil in het percentage CZV-verwijdering na 1, 2 of 3 jaar? We testen 10 bakken die we na 1, 2 en 3 jaar onderzoeken."
"Wat is het effect van ijzertoevoeging aan het zand op de P-verwijdering? Wat is het het langetermijneffect?"
Multifactoriële ANOVA: Interactie
Voorbeeld:
"Is er een significant verschil tussen onbeplante systemen en systemen beplant met riet die op zand of grind zijn geplant?"

Het effect van beplanten is niet hetzelfde voor zand of grind.
Full transcript