Summary Class notes - Methoden en Technieken II

Course
- Methoden en Technieken II
- M. van Meeteren, A.A.T. Ramakers
- 2015 - 2016
- Universiteit Leiden (Universiteit Leiden, Leiden)
- Criminologie
222 Flashcards & Notes
3 Students
  • This summary

  • +380.000 other summaries

  • A unique study tool

  • A rehearsal system for this summary

  • Studycoaching with videos

Remember faster, study better. Scientifically proven.

PREMIUM summaries are quality controlled, selected summaries prepared for you to help you achieve your study goals faster!

Summary - Class notes - Methoden en Technieken II

  • 1450911600 HC 1: Inleiding, herhaling en samenhang (correlaties)

  • Afhankelijke en onafhankelijke variabelen
    Afhankelijke variabele (Y): de variabele die je meet, dat waar je als onderzoeker geïnteresseerd in bent. Het zijn de kenmerken die we in een onderzoek willen verklaren.
    Onafhankelijke variabele (X): de factoren die de afhankelijke variabele bepalen/beïnvloeden (de voorspellers).
    Oorzaak (onafhankelijke variabele) --> gevolg (afhankelijke variabele).
  • Nominaal meetniveau
    Getallen worden toegekend aan waarnemingen en hebben geen andere functie dan alleen de waarnemingen een label te geven. Voorbeelden: geslacht, religie, etnische groepen en diersoorten.
  • Ordinaal meetniveau
    Er zit een rangorde in de getallen die aan de metingen zijn toegekend, er is wel hiërarchie maar zonder gelijke intervallen. Voorbeeld: opleiding.
  • Interval meetniveau
    Er is een hiërarchie rangorde met vaste intervallen (verschillen tussen metingen heeft een vaste betekenis), maar er is geen vast nulpunt. Voorbeelden: temperatuur, schoenmaat, IQ.
  • Ratio meetniveau
    Classificatie, vaste rangorde, gelijke intervallen en een vast nulpunt. Voorbeelden: prijs van een product, frequentietelling.
  • Maten van centrale tendentie
    - Gemiddelde: totale score gedeeld door het aantal waarnemingen (gevoelig voor outliers).
    - Mediaan: zet steekproef op chronologische volgorde en bekijkt op welke waarde op 50% van de steekproef behaald is (outliers vallen er op deze manier erbuiten).
    - Modus: waarde die het meeste voorkomt binnen de verdeling.
  • Standaarddeviatie
    De gemiddelde afwijking van het gemiddelde (wortel van de variantie).
  • Variantie
    Sx^2 - De gemiddelde gekwadrateerde afwijking van het gemiddelde (bij populatie N-1 doen).
  • Z-score
    Afstand tot het gemiddelde uitgedrukt in aantallen standaarddeviaties. Bereken: (Getal (x, waarvan je z-score wilt weten) - gemiddelde) / standaarddeviatie.
  • Pearson's R vs. Spearman's Rho
    Met interval/ratio-variabelen kun je meestal volstaan met Pearson's R, maar er moet wel tenminste één variabele bij benadering normaal verdeeld zijn. Pearson's R is wel heel gevoelig voor outliers (in het geval van extreme waarden mag het dan ook niet gebruikt worden). Als er geen sprake is van een normaalverdeling of wel sprake van outliers, dan moet Spearman's Rho gebruikt worden. Deze wordt tevens ook gebruikt om ordinale variabelen aan elkaar te relateren.
  • Kruistabel
    Wanneer je groepen wilt vergelijken, kun je gebruik maken van een kruistabel. Dit kan echter alleen wanneer er nominale of ordinale variabelen zijn en er mogen niet te veel categorieën zijn, omdat er minimaal 5 verwachte waarnemingen per cel moeten zijn.
  • Chi-kwadraat
    De Chi-kwadraat toets wordt gebruikt bij kruistabellen. De toets toetst de nulhypothese. Je moet de formule invullen aan de hand van de tabel en de vrijheidsgraden uitrekenen (aantal rijen-1 * aantal kolommen-1). Deze twee getallen moet je opzoeken in de tabel van Field - hier komt dan uit of de samenhang significant is.
  • 1450998000 HC 2: Samenhang: vergelijken van groepen

  • Onafhankelijke en afhankelijke metingen
    - Onafhankelijke meting: meting waarbij je meerdere groepen vergelijkt, en deze groepen zijn maar op één moment gemeten.
    - Afhankelijke meting: dezelfde groep mensen is op meerdere momenten ondervraagd.
  • Odds ratio
    Om de sterkte van het verband in een kruistabel (met chi-kwadraattoets) te bepalen wordt de odds ratio gebruikt. Wanneer OR=1 is er gen verband (wordt alleen bij 2x2 tabellen gebruikt!). Je doet bij de uitkomst van de odds ratio uitspraak over de kansverhouding, niet over kansen! 
    (Wanneer je de OR wilt berekenen over een bepaalde groep, dan moet je beginnen in de berekening met die groep).
  • T-toets (independent samples test)
    De T-toets wordt gebruikt bij het vergelijken van twee onafhankelijke groepen. De vraag hierbij is of het verschil in de gemiddelden significant is. De vrijheidsgraden moeten bij deze test anders berekend worden, namelijk: (n(a)-1)+(n(b)-1). De Sdiff in de formule is de standaardfout, deze moet je als eerste berekenen. Je moet als je de t-waarde en df hebt, in de tabel van Field kijken.
  • Type I fout
    Hierbij wordt de nulhypothese onterecht verworpen: je constateert een verband terwijl dit er in werkelijkheid niet is.
  • Type II fout
    Je verwerpt onterecht de onderzoekshypothese en neemt dus onterecht de nulhypothese aan.
  • Levene's test for equality of variance
    Deze test wordt door SPSS bij de t-toets uitgevoerd. Deze test kijkt naar de variantie van de twee groepen op het antwoord (verschillen ze veel of zijn de groepen gelijk?). Het gemiddelde kan namelijk wel hetzelfde zijn van de twee groepen, maar bij de een hele uiteenlopende antwoorden gegeven en bij de andere heel dicht bij het gemiddelde. Als de test significant is, moet je vervolgens in de onderste rij kijken 'equal variance not assumed', omdat dit betekent dat de groepen niet gelijk zijn in het geven van antwoorden.
  • ANOVA
    Deze test gebruik ja als er meer dan twee onafhankelijke groepen vergeleken worden. Bij deze toets wordt de significantie bepaald door informatie over de variantie binnen en tussen de groepen te combineren met informatie over vrijheidsgraden.
    SS(m) + SS(r) = SS(t)
    SS(t) = verschil van iedere individuele waarneming met het overall gemiddelde.
    SS(m) = verschillen tussen de groepen
    SS(r) = verschillen binnen de groepen   
    Df = N-1
    Met de df-waarde en de SS(t) kun je de F-ratio berekenen. Deze kijkt naar de verklaarde variantie ten opzichte van de onverklaarde variantie. Hoe groter de F, hoe groter de kans op significantie. Met deze waardes moet je in de tabel van Field kijken.
  • Post-hoc toets
    Als je wilt weten bij de ANOVA test welke groep van welke verschilt (omdat er meerdere groepen zijn), moet je de post-hoc toets doen. Een voorbeeld is de Bonferroni-toets.
  • Mann-Whitneytoets
    Non-parametrische variant van de T-toets. Deze toets vergelijkt rangscores tussen de twee groepen in plaats van werkelijke scores en beschermt dus beter tegen outliers. De toets kijkt naar de plaats van het getal, dus niet naar het getal zelf (zelfde als Kruskall-Wallis).
  • Kruskall-Wallistoets
    Non-parametrische variant van ANOVA. De toets vergelijkt rangscores in plaats van de werkelijke scores en beschermt dus beter tegen outliers. De toets kijkt naar de plaats van het getal, niet naar het getal zelf (zelfde als Mann-Whitney).
Read the full summary
This summary. +380.000 other summaries. A unique study tool. A rehearsal system for this summary. Studycoaching with videos.

Latest added flashcards

Wat kan soms een verklaring zijn bij een hele hoge Cronbach's alpha en hoe controleer je dit?
Dat de schaal bestaat uit meerder factoren. 
Dit kan worden gecontroleerd door:
- Prinicpale componentenanalyse (PCA) - kijkt naar verschillen
- Factoranalyse (FA) - kijkt naar samenhang

Hiermee wordt gekeken of de schaal homogeen of heterogeen is en of er niet meerdere latente concepten tegelijk worden gemeten. 
Wat doet spss met de missings bij schaalvariabelen en wat is hiervoor de oplossing?
SPSS haalt de missings er automatisch uit. Dit zorgt er soms voor dat een groot deel van de data verloren gaat doordat er bijv. één vraag niet is ingevuld. Dit kan men oplossen door een minimaal te beantwoorden aantal vragen aan te geven en hiervan het gemiddelde te gebruiken.
Wat zijn de drie stappen bij het aanmaken van een schaalvariabele?
1) Betrouwbaarheid checken d.m.v. een betouwbaarheidsanalyse met de Cronbach's alpha
2) Validiteit nagaan - klopt de schaal theoretisch gezien?
- zijn alle aspecten van het construct bevraagd?
- zitten er aspecten/items tussen die eigenlijk niet binnen dit concept passen
3) Zijn er veel missings? - Zo ja; stel een minimum in bij het aantal te beantwoorden vragen en gebruik daarvan het gemiddelde.
Hoe weet je of er sprake is van een goede schaal?
Door het uitvoeren van een betrouwbaarheidsanalyse; Cronbach's alpha
vuistregel; bij 0.80/0.70 is er sprake van een betrouwbare schaal.

Wanneer de alpha met 0.05 omhoog gaat bij het verwijderen van een variabele wordt dit vaak gedaan. 
Wat gebeurt er bij het heroveren van de schaalvariabelen?
Dan worden alle variabelen omgezet zodat ze in dezelfde richting staan. Zo kunnen ze het beste gemeten/vergeleken worden.
Waarom zou je een schaal maken bij meerdere facetten?
Het stellen van slechts één vraag levert problemen op met
1) heterogeniteit
2) betrouwbaarheid
3) een specifiek onderscheid maken 
Wat zijn latente concepten?
Dit zijn concepten die niet met één vraag te meten zijn omdat er meerdere facetten bij komen kijken. 

Dit is vaak het geval bij theoretische/abstracte vraagstukken. 
Vergelijk de vijf assumpties van een lineaire regressie met die van een logistische regressie
1) Onafhankelijkheid - dit wordt niet gemeten bij een logistische regressie
2) Normaalverdeling - een logistische regressie is niet normaal verdeeld maar binomiaal verdeeld (dit levert een U-vorm op)
3) Homoscedasticiteit - er is geen sprake van homoscedasticiteit, maar juist heteroscedasticiteit omdat er gekeken wordt naar de uitkomst als wel/niet. Hier hoeft dus niet voor gecontroleerd te worden.
4) Multicollineariteit - dit kan wel gecontroleerd worden, maar dit moet via de lineaire regressie
5) Outliers - outliers kunnen op dezelfde manier gecontroleerd worden als bij een lineaire regressie (Cook's D)
Wat zegt de (Exp)B in de spss output?
De (Exp)B is de kolom van de odds ratio. Dit geeft weer wat de kansverhouding is dat iets wel vs. niet gebeurt. Ook dit wordt niet uitgedrukt in precieze getallen maar aan de hand van de richting van het verband kan bepaald worden of er een grote of kleine kans is op dat iets gebeurt.
Wat zegt de B in de spss output?
De B is de kolom van de Logodds. Dit geeft weer hoeveel de natuurlijke logodds veranderen wanneer x met één eenheid veranderd. Je kan hierbij wel zeggen een kans groter of kleiner wordt maar niet precies met hoeveel.