Deze pagina is nog in aanbouw. We geven hier een selectie van door ons gesignaleerde vragen. Indien er andere vragen zijn: vragen staat vrij.
Deel I Inleiding Methoden en Technieken
  1. Wanneer gebruik ik welk meetniveau?
  2. Wanneer gebruik ik welke centrale tendentiemaat en spreidingsmaat?
  3. Wanneer gebruik ik grafiek voor de verdeling van een variabele?
  4. Hoe lees ik een (drieweg-)kruistabel?
  5. Wanneer deel ik bij het berekenen van de variantie (en de standaarddeviatie) door n, en wanneer door n-1?
Deel II Toetsende Statistiek
  1. Wanneer moet ik kansen optellen, en wanneer vermenigvuldigen?
  2. Wanneer verwerp ik H0?
  3. Hoe bepaal ik het aantal vrijheidsgraden?
  4. Wat is het verschil tussen een alpha en een P-waarde?
  5. Een- en tweezijdig: moet ik alpha en/of de P-waarde halveren of verdubbelen?
  6. Wat is conservatief in de statistiek?
  7. Hoe zit het nu met het toetsen van varianties vooraf aan het doen van een t-toets?
  8. Hoe toets ik nu de Chi2: één - of twee zijdig?
Deel III Experimentele Proefopzettenleer
  1. Wanneer gebruik ik welke correlatiecoefficient?
  2. Hoe kom ik aan de verwachte frequenties bij een meerwegtabel?
  3. Hoe formuleer ik hypothesen bij een tweeweg ANOVA

Antwoorden op vaak gestelde vragen

Deel I Inleiding Methoden en Technieken
  1. Wanneer gebruik ik welk meetniveau?

    Van nominaal naar absoluut meetniveau worden de eisen die aan de variabelen en hun schaalwaarden worden gesteld steeds strenger, terwijl alle eisen uit de lagere meetniveau's van kracht blijven. Dus een intervalniveau variabele voldoet ook aan alle eisen voor nominale en ordinale variabelen.

    • Nominaal is van toepassing op variabelen met waarden die alleen maar dienen om objecten/personen van elkaar te onderscheiden. Voorbeelden hiervan zijn: geslacht, respondentnummer, geboorteplaats.
    • Ordinaal is van toepassing op variabelen met waarden die op een bepaalde dimensie (grootte, sterkte, intensiteit) geordend kunnen worden van laag naar hoog. Voorbeelden hiervan zijn: Attitudevragen met antwoorden varierend van helemaal mee eens tot helemaal niet mee eens,
    • Interval is van toepassing op variabelen met vaste afstanden tussen de opeenvolgende schaalwaarden, maar zonder vast nulpunt. Een klassiek voorbeeld hiervan is temperatuur. Dat wordt gemeten in graden celsius en graden kelvin. Voor zowel de celsius als de kelvin schaal geldt dat de afstand van 7 naar 8 graden even groot is als van 56 naar 57 graden. 0 graden celsius is 273.15 graden kelvin.
    • Ratio is van toepassing op variabelen met een vast nulpunt. Voorbeelden hiervan zijn: lengte, gewicht, snelheid, inkomen, tijd.

  2. Wanneer gebruik ik welke centrale tendentiemaat en spreidingsmaat?

    Van nominaal naar interval meetniveau nemen de mogelijkheden voor het bepalen van beschrijvende maten toe. De beschrijvende maten voor de lagere meetniveau's zijn weliswaar nog steeds geschikt, maar maken alleen minder gebruik van de specifieke eigenschappen van het meetniveau van de variabele. Bij een bepaalde centrale tendentiemaat hoort een spreidingsmaat.

    • De modus wordt gebruikt voor variabelen met nominaal meetniveau. Er is geen spreidingsmaat voor nominale variabelen.
    • De mediaan wordt gebruikt voor variabelen met ordinaal meetniveau. De bijbehorende spreidingsmaat is de interkwartiel afstand (IQR).
    • Het gemiddelde wordt gebruikt voor variabelen met Interval meetniveau en hoger. De bijbehorende spreidingsmaat is de standaarddeviatie (s).
    Er zijn nog andere spreidingsmaten zoals de range of de variantie (s2), maar deze maten geven of minder informatie (range) of zijn direct uit een al genoemde maat af te leiden (s2 uit s).

  3. Wanneer gebruik ik welke grafiek voor de verdeling van een variabele?

    Van nominaal naar interval meetniveau nemen de mogelijkheden voor het in beeld brengen van de verdeling toe. De beschrijvende maten voor de lagere meetniveau's zijn weliswaar nog steeds geschikt, maar maken alleen minder gebruik van de specifieke eigenschappen van het meetniveau van de variabele.

    • De barchart of het staafdiagram wordt gebruikt voor variabelen met nominaal meetniveau. Wanneer het aantal categorieen groot is kan beter voor een frequentietabel worden gekozen.
    • De boxplot wordt gebruikt voor variabelen met ordinaal meetniveau en een redelijk aantal categorieen.
    • Het histogram wordt gebruikt voor variabelen met Interval meetniveau en hoger. Het aantal klassen ligt meestal tussen de 5 en de 15.
    NB de barchart kan eventueel ook voor variabelen met ordinaal meetniveau en een klein aantal categorieen worden gebruikt, maar dan is vaak een frequentietabel te prefereren.

  4. Hoe lees ik een (drieweg-)kruistabel?
  5. Wanneer deel ik bij het berekenen van de variantie (en de standaarddeviatie) door n, en wanneer door n-1?
Deel II Toetsende Statistiek
  1. Wanneer moet ik kansen optellen, en wanneer vermenigvuldigen?
  2. Wanneer verwerp ik H0?
  3. Hoe bepaal ik het aantal vrijheidsgraden?
  4. Wat is het verschil tussen een alpha en een P-waarde?
  5. Een- en tweezijdig: moet ik alpha en/of de P-waarde halveren of verdubbelen?
  6. Wat is conservatief in de statistiek?

    Conservatief betekent binnen de toetsende statistiek behoudend, met betrekking tot de H0 ofwel minder snel H0 verwerpen. Dit kan een eigenschap zijn van de bepaalde toetsvorm in vergelijking met andere toetsvormen. Bijvoorbeeld

    • tweezijdig toetsen is conservatiever dan eenzijdig toetsen, omdat je in het tweede geval (bij een goede hypothese) sneller kan verwerpen.
    • De t toets is bij een gelijk aantal waarnemingen conservatiever dan de z toets omdat de t* voor een bepaalde a groter is dan z*, omdat je bij de z toets s weet en bij de t toets moet schatten.
    Het kan ook een eigenschap zijn van de onderzoeker, die door a klein te kiezen (bijv 0.01 of 0.001 in plaats van 0.05) het verwerpen van H0 minder makkelijk maakt. Let op dat conservatief toetsen een negatieve invloed op de power van de toets heeft

  7. Hoe zit het nu met het toetsen van varianties vooraf aan het doen van een t-toets?

    Dit is een link tussen college en SPSSpractica. In M&M wordt het toetsen van gelijkheid van varianties gedaan met een F toets, maar dit wordt dan als niet zo nuttig betiteld omdat de F-toets veel gevoeliger is voor verschillen in variantie dan dat de t-toets.

    SPSS gebruikt de Levene toets. Deze toets is robuster met betrekking tot tot schendingen van normaliteit dan een F toets. De Levene toets geeft dus betrouwbaarder informatie over de invloed van variantie'problemen' op de correctheid van de daaropvolgende t-toets. In het geval van ongelijke groepsgroottes moet de Levene toets serieus genomen worden. Zijn de 2 groepen even groot dan is er weliswaar nog steeds sprake van een homogeniteitsprobleem, maar daar is de t-toets voor gelijke varianties wel tegen opgewassen. Ook informatief is het om even te spieken bij de t toets output. Als beide varianten van de t-toets hetzelfde resultaat opleveren (qua grootte van p) dan maakt blijkbaar het niet uit wat je kiest. Geven ze wel verschillende uitkomsten dan is er blijkbaar iets aan de hand en moet je de Levene er bij betrekken

    Conclusie: wel naar de Levene toets kijken.
  8. Hoe toets ik nu de Chi2: één - of twee zijdig?

    Sheet 4 van week 8 zegt dat dit probleem bij de Chi2 toets niet speelt, Dit komt overeen met M&M p. 628 waar staat We cannot describe Ha as either one-sided or two-sided, because it includes all of the many kinds of asscociation that are possible.
    Deze op zichzelf duidelijke uitspraak wordt enigszins vertroebeld door een opmerking van M&M op p. 632 The chi-square test always tests the two sided alternative. Deze tweede uitspraak moet worden gelezen in de kontekst van het vergelijken van de z-toets met de Chi2 toets en slaat alleen maar op de 2 * 2 tabel, waarvoor H0: p1=p2 en Ha: p1<> p2. Dit is in het geval van een 2 * 2 tabel voor de Chi2 toets de enige mogelijkheid. Voor grotere tabellen ligt dat niet zo eenvoudig, omdat de H0 dan is dat alle geobserveerde proporties gelijk zijn aan hun voorspelde waarden, maar de Ha kan dan alleen maar zeggen dat dit niet zo is. Maar Ha bevat zowel de uitspraak dat er 1 geobserveerde proportie ongelijk is aan zijn voorspelde waarde en de rest wel, als dat 2 proporties zijn waarvoor dit geldt, etc en dat dan in allerlei mogelijke combinaties.

    SPSS draagt ook nog wat bij aan de verwarring door het gebruik van de kop (Asymp. Sig. 2-sided) in de uitvoer bij de Chi2 toets. Deze kop suggereert dat er sprake zou zijn van een tweezijdige toets. SPSS is echter berucht om zijn inconsistente labeling in de uitvoer van de kansgebieden (p's) bij de berekende toetsstatistieken.

    Vergelijking van afbeelding 11.5 en 11.7 in De Vocht Basishandboek SPSS laat dit zien: twee statistieken Chi2 en Cramers V die voor een 2 * 2 tabel identieke resultaten geven maar met verschillende kopjes boven de p-waarden.

    Het advies is om de SPSS opmerking over twee-zijdigheid te negeren.

    Conclusie: Er wordt in het algemeen niet gesproken over één - of tweezijdige toetsing bij de Chi2 toets. Gebruik alleen de rechterstaart van de verdeling bij de bepaling van het verwerpingsgebied. Negeer de SPSS opmerking in de uitvoer over twee-zijdigheid.

Deel III Experimentele Proefopzettenleer
  1. Wanneer gebruik ik welke correlatiecoefficient?
  2. Hoe kom ik aan de verwachte frequenties bij een meerwegtabel?
  3. Hoe formuleer ik hypothesen bij een tweeweg ANOVA

    In de hypothesetoetsing bij de tweeweg ANOVA in Moore & McCabe wordt een belangrijke stap overgeslagen, namelijk het formuleren van de stelsels hypothesen over de verwachte effecten van de verschillende condities. Ook in de werkgroep is daar ten onrechte geen aandacht aan geschonken; vandaar deze toelichting.

    Neem als voorbeeld een factorieel design met 2 factoren A en B. A heeft 3 niveau's en B heeft 2 niveau's.

    Je kunt nu beginnen met het stelsel hypothesen voor het hoofdeffect A in de vorm:
    H0 : m A1= m A2= m A3
    HA : niet H0

    NB Bij HA kun je natuurlijk ook nog alternatieve formuleringen gebruiken zoals Dat is niet zo of tenminste één mAi wijkt af.

    Deze aanpak gaat ook nog goed voor hoofdeffect B, maar voor het stelsel hypothesen voor de interactie AB gaat het fout, omdat in de 6 interactiegemiddelden mABij ook nog het aandeel van de hoofdeffecten zit. Als je dan stelt dat alle mABij aan elkaar gelijk zijn, doe je eigenlijk een uitspraak over zowel interactie- als hoofdeffecten.

    Vandaar dat we voor het opstellen van de hypotheses bij een tweeweg ANOVA, niet de gemiddelden maar de effectparameters zullen gebruiken omdat bij effectparameters de bijdragen van hoofd- en interactie-effecten netjes gescheiden zijn.

    Het stelsel hypothesen voor het hoofdeffect A wordt nu:
    H0 : a1 = a2 = a3 = 0
    HA : niet H0

    Het stelsel hypothesen voor het hoofdeffect B wordt nu:
    H0 : b1 = b2 = 0
    HA : niet H0

    Het stelsel hypothesen voor het interactie-effect AB wordt nu:
    H0 : ab11 = ab21 = ab31 = ab12 = ab22 = ab32 = 0
    HA : niet H0

    De H0 kan ook met indices worden genoteerd. Deze notatie is in het geval van meer dan 2 factoren en / of veel niveau's, overzichterlijker, dan wanneer je alles uitschrijft.

    Voor hoofdeffect A: H0 : ai = 0, i = 1..3
    Voor hoofdeffect B: H0 : bj = 0, j = 1..2
    Voor interactie-effect AB: H0 : ab ij = 0, i = 1..3, j = 1..2