Summary Introd. Practice Statistics

-
ISBN-10 1429286644 ISBN-13 9781429286640
217 Flashcards & Notes
9 Students
 • This summary

 • +380.000 other summaries

 • A unique study tool

 • A rehearsal system for this summary

 • Studycoaching with videos

Remember faster, study better. Scientifically proven.

This is the summary of the book "Introd. Practice Statistics". The author(s) of the book is/are W H Freeman. The ISBN of the book is 9781429286640 or 1429286644. This summary is written by students who study efficient with the Study Tool of Study Smart With Chris.

PREMIUM summaries are quality controlled, selected summaries prepared for you to help you achieve your study goals faster!

Summary - Introd. Practice Statistics

 • 1 chapter 6: introduction to inference

 • Statistische gevolgtrekkingen ( statistical interference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata
 • Doel statistische inferentie
  trekken van conclusies uit gegevens
 • informele inferentie
  nadruk ligt op onderbouwen van onze conclusies met kansberekeningen
 • Statistische significantie
  Als de overschrijdingskans kleiner dan of gelijk is aan alfa ( de griekse letter ) zeggen we dat de data statistisch significant zijn op niveau sigma
 • 1.1 Toets voor één gemiddelde

 • Wat zijn experimentele units?
  Individuen waarop het experiment wordt uitgevoerd (subjects wanneer het mensen betreft).
 • Wat is een treatment (behandeling)?
  Een experimentele conditie waaraan units worden blootgesteld.

 • Wat is een factor?
  Onafhankelijke variabele in een experiment. Deze kan uit verschillende niveau's bestaan (levels).
 • Wat zijn de voordelen van een experiment ten opzichte van observationele studies?
  Er kan een oorzaak-gevolg relatie worden aangewezen, omdat door aselecte toewijzing de invloed van storende variabelen teniet wordt gedaan.

 • Wat is een tweefactor experiment?
  Een experiment met twee onafhankelijke variabelen.

 • Wat is een voordeel van een tweefactor experiment?
   
  De invloed van meerdere onafhankelijke variabelen kan onderzocht worden, plus de combinatie van die twee (ook wel interactie genoemd).

 • Wat is een interactie effect?
  De combinatieinvloed van twee onafhankelijke variabelen op een afhankelijke variabele.

 • Hoe bereiken we controle in experimenten?
  1. Door experimentele groepen en controle groepen.
  2. Controlegroep een nep medicijn geven om placebo effect tegen te gaan.

 • Wat is het placeboeffect?
  Patiënten kunnen positief reageren op een medicijn, omdat ze weten dat ze een medicijn krijgen.

 • Wat gebeurt er bij gebrek aan controle?
  Bias (systematische vertekening)
 • Bij het toewijzen van proefpersonen aan condities, moet de invloed van achtergrondvariabelen uitgesloten worden. Groepen moeten dus op alle achtergrondvariabelen vergelijkbaar zijn.
 • Wat is randomisatie/random toewijzing?
  Het plaatsen van proefpersonen in condities op zo'n manier dat elke proefpersoon een even grote kans heeft op plaatsing in elke experimentele conditie.

 • Wat is een random steekproef?
  Een steekproef die zo getrokken is dat de steekrpoef representatief is voor de populatie.
 • Aselect trekken is geen eis voor een experinebt, want je kunt nog steeds een oorzaak-gevolg relatie vinden als je aselect hebt toegewezen. Je weet alleen niet of je de causale relatue kunt generaliseren naar de populatie.
 • Wat is double blind?
  Noch de deelnemer als de onderzoeker weet welk medicijn/behandeling de deelnemer krijgt. Dit voorkomt dat de uitkomsten vertekend worden door verwachtingen van de onderzoeker of deelnemer.
 • Aandachtspunt bij experimenten: Gebrek aan realisme --> In een experimentele setting gedraagt men zich vaak anders dan in het echt.
 • Wat is een nadeel van randomisatie?
  Verschillen tussen individuen vergroot de ruis.

 • Wat is een mactched pairs design?
   
  ppn worden gematched in paren. Bijvoorbeeld paren van ppn met dezelfde leeftijd, hetzelfde geslacht, en hetzelfde inkomen. Omdat beide personen binnen een paar op elkaar lijken, is het vergelijken van de responsen van beiden efficiënter dan ongematchte ppn.
   
  Echter: Per paar wel beiden random toewijzen aan verschillende condities.

 • Wat is een speciaal geval van gematchte paren?
   
  één persoon krijgt beide behandelingen en wordt beide keren geobserveerd (elke pp is dus zijn/haar eigen controle).

 • Wat zijn de voordelen van gematchte paren?
   
  Meer power: Effecten worden sneller gedetecteerd.

  Minder ppn nodig: worden voor beide condities gebruikt (alleen bij herhaalde metingen).

 • Wat zijn de nadelen van matched pairs designs?
   
  herhaalde metingen = volgorde effecten.
  Oplossing: volgorde variëren per persoon

 • Wat zijn block designs?
  Je maakt gele groepen mensen die op elkaar lijken. 
  Generalisatie van gematchte paren designs naar grotere groepen.
 • Wat is een steekproevenverdeling?
   
  stel we trekken oneindig vaak een steekproef uit een normale verdeling, dan zullen de gemiddelden van die steekproeven ook weer een normaalverdeling hebben. Deze verdeling heet ook wel de steekproevenverdeling.

 • Wat kun je doen als  σ niet bekend is (wat vaak voorkomt).
  Gebruik de steekproef standaarddeviatie s. Hierdoor krijgen we een schatter van de standaarddeviatie van de steekproevenverdeling, namelijk  s/√n . Deze wordt ook wel de standard error SE x van het gemiddelde x genoemd. 
  Echter, deze statistische maat heeft géén z-verdeling maar een t-verdeling: t = x - u/s:n
  met n-1 vrijheidsgraden.
 • Wat doe je als σ wel bekend is?
  Dan transformeren van x tot een z-score: z = x-u/ σ: √n
   
  Deze z-score heeft een normaalverdeling met μ =  0, σ = 1, ofwel een standaard normale verdeling. 
  Alleen van de standaardnormale verdeling zijn de kansen berekend voor een groot aantal waarden (Tabel A, MM&C). Zo kan voor elke normaalverdeling met bekende σ de kansen worden bepaald.
 •  
  Voorbeeld t-toets voor één gemiddelde
   
  Een onderzoekster is geïnteresseerd in de vraag of pedagogiekstudenten gemiddeld slimmer zijn dan de gemiddelde Nederlander. Uit de populatie pedagogiekstudenten wordt een aselecte steekproef getrokken van n = 20 en deze moeten allen een volledige IQ-test afleggen. Bekend is dat het IQ van de Nederlandse bevolking normaal verdeeld is met een gemiddelde van µ = 100.
  Het gemiddelde IQ van deze steekproef blijkt
  te zijn. De standaarddeviatie van de steekproef is S = 14.78. Kunnen we hier nu uit concluderen dat pedagogiekstudenten gemiddeld slimmer zijn dan de gemiddelde Nederlander?
   
  H0: ? = 100
   
  Ha: ? > 100
  (x = 112.95
  s = 14.78
  n = 20
  t = x - u/s:wortel n
   = 112.95 - 100/14.78:wortel 20 =  3.92
   Is de gevonden t-waarde significant?
   
  df = 20 - 1 = 19
  Opzoeken gevonden t-waarde in tabel bij df = 19. (Tabel D, MM&C). Grootste t-waarde = 3.883. Gevonden t-waarde van 3.92 is groter dan grootste t-waarde in tabel.
   
  Bijbehorende kans: p < 0.0005 ? H0 verwerpen.
   
  Het gemiddelde IQ van pedagogiekstudenten is hoger dan dat van de gemiddelde Nederlander.
   
  Tweezijdig toetsen
   
  Soms heeft de onderzoeker van tevoren geen idee hoe het gemiddelde IQ van pedagogiek studenten verschilt tov het IQ van de gemiddelde Nederlander. In dat geval moeten we tweezijdig toetsen.
  De alternatieve hypthese wordt nu:
   
  Ha: ? ? 100
  (Het gemiddelde IQ verschilt van het IQ van de gemiddelde Nederlander, maar we weten niet hoe).
  In dat geval vermenigvuldigen we p met  2.
 •  
  Betrouwbaarheidsinterval t-toets voor een gemiddelde
   Stel dat de oppervlakte tussen -t* en t* van een t(k)-verdeling C% bedraagt, dan wordt het
  C% betrouwbaarheidsinterval van ? als volgt berekend:
  x +- t* s/worteln

  x = 112.95
  s = 14.78
  n = 20
  t* = 2.093
  112.95 +- 2.093 x 14.78/wortel20
  --> 106.93 <_u<_119.87
   
  Het gemiddelde IQ van de populatie pedagogiek studenten ligt tussen 106.93 en 119.87 met 95% zekerheid.
 • Bij T-toets voor één gemiddelde bij SPPS One Sample T-test gebruiken.
  Let op: SPSS toetst altijd tweezijdig!

Read the full summary
This summary. +380.000 other summaries. A unique study tool. A rehearsal system for this summary. Studycoaching with videos.

Latest added flashcards

  Wat te doen bij ernstige schending van normaliteit?
 
Outliers (uitbijters): weghalen als data duidelijk niet tot populatie behoren. Als data wel tot populatie behoren: andere statistische technieken gebruiken.
Transformeren data: als data scheef zijn, transformeer data. Bv: neem de logaritme van de scheve variabele.
Andere standaard verdelingen: sommige processen worden beter beschreven door andere verdelingen bv de Weibull verdeling.
Bootstrap methoden of permutatie toetsen: vereisen geen normaliteit of welke verdelingsvorm ook.
Andere nonparametrische methoden: idem als bij bootstrap methoden. Verschil: maken geen gebruik van van de werkelijke waarden van de observaties.
Wat zijn de bedreigingen voor de interne validiteit bij designs die  twee of meer groepen bestuderen, voor en na de Quasi-onafhankelijke variabele ?
 
Selection bias
Local history
Wat zijn de  bedreigingen voor interne validiteit bij  Designs die één groep bestuderen, voor en na de Quasi-onafhankelijke variabele?
 
History
Maturation
Regression to the mean
Pretest Sensitization
Wat zijn de voorwaarden om een oorzaak-gevolg relatie vast te kunnen stellen?
 
1.1. Onafh variabele gaat vooraf in de tijd aan afh variabele.
2.2. Oorzaak en gevolg covariëren (hangen samen).
3.3. Alle alternatieve verklaringen moeten uitgesloten kunnen worden als gevolg van randomisatie en experimentele controle.
Quasi-experimentele designs voldoen alleen aan voorwaarden 1 en 2.
Wat is een voordeel van een longitudinaal design t.o.v. een crossectioneel design?
 
Mogelijk om verandering met de leeftijd te onderzoeken van individuele ppn.
Wat is een nadeel van een crossectioneel design?
 
Nadeel: Generational effects. Mensen verschillen niet alleen qua leeftijd maar ook qua omstandigheden waarin ze zijn opgegroeid.
Wat is een cross-sectioneel design?
 
Vergelijken van verschillende leeftijdsgroepen op één tijdstip.
Wat zijn de nadelen van een longitudinaal design?
 
Moeilijk ppn te vinden die voor langere periode mee willen doen.
Ppn die wel willen meedoen kunnen verhuizen of overlijden → Uitval (attrition).
Het kost veel tijd, geld, en moeite.
Wat is een longitudinaal design?
 
Bij longitudinale designs: onafhankelijke variabele is de tijd zelf.
O1 O2 O3 O4 O5
Vooral door ontwikkelingspsychologen (maar ook pedagogen) gebruikt. Bestuderen van leeftijdsgerelateerde veranderingen in hoe mensen denken, voelen en zich gedragen.
Aandachtspunt bij longitudinaal design: sommige veranderingen hoeven niet door leeftijd te komen, maar door andere dingen.
Bv: hand oog coördinatie verbetert bij kinderen doordat ze aan sport doen ipv door leeftijd zelf.
Wat is het comparative time series design?
 
Twee of meer variabelen die aan elkaar gerelateerd zijn onderzoeken over de tijd.
Als veranderingen van ene variabele samenhangen met veranderingen van andere variabele over de tijd, indirect bewijs dat de één de ander veroorzaakt.
Nadeel: Nooit zeker of er niet geobserveerde variabelen in het spel zijn, die beide beïnvloeden. Soms ook niet zeker het één het ander veroorzaakt, of juist andersom.