Samenvatting Introduction to the practice of statistics

-
ISBN-10 1429286628 ISBN-13 9781429286626
565 Flashcards en notities
13 Studenten
  • Deze samenvatting

  • +380.000 andere samenvattingen

  • Een unieke studietool

  • Een oefentool voor deze samenvatting

  • Studiecoaching met filmpjes

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

Dit is de samenvatting van het boek "Introduction to the practice of statistics". De auteur(s) van het boek is/zijn David S Moore, George P McCabe, Bruce A Craig. Het ISBN van dit boek is 9781429286626 of 1429286628. Deze samenvatting is geschreven door studenten die effectief studeren met de studietool van Study Smart With Chris.

PREMIUM samenvattingen zijn gecontroleerd op kwaliteit en speciaal geselecteerd om je leerdoelen nog sneller te kunnen bereiken!

Samenvatting - Introduction to the practice of statistics

  • 1 Linting: Cohen's D p. 347-353

  • Effectgrootte: waarom berekend?

    - Om grootte van het effect aan te geven.
    - Is onafhankelijk van de steekproefgrootte en vrij van 'arbitraire meeteenheden'.


  • Effectgrootte: formule?
    Cohen's d: d = [Xgem1-Xgem2] / [wortel van (s1^2+s2^2) / 2]
  • Effectgrootte: wanneer klein, medium of groot?
    - Klein: 0.2 - 0.4.
    - Medium: 0.5 - 0.7.
    - Groot: 0.8 en hoger.

  • Interpretatie Cohen's d
    - Maat voor de hoeveelheid niet-overlap tussen twee distributies. Hoe groter [d], hoe minder overlap.
    - Wanneer effect relevant is hangt af van onderzoeksdoel.
  • 1.1 Displaying Distributions with Graphs

  • Wat zijn variabelen?
    Kenmerk van een case
  • Welke grafieken kun je gebruiken bij categorische variabelen?

    Staafdiagram en cirkeldiagram

  • Wat is statistiek?
    Statistiek is de wetenschap van kennis opdoen op basis van data
  • Categorical Variable

    Places a Case into one of several groups or categories

  • Welke grafieken kun je gebruiken bij numeriek (kwantitatieve) variabelen?

    Stemplot, frequentietabel en histogram

  • Waaruit bestaat data?
    Data bestaat uit numerieke waarden
  • De verdeling van een categorische variabele maakt een lijst van de categorieën en geeft de tel of het percentage van de cases die in elke categorie vallen.

  • Quantitatieve Variabele?
    Numeriek
  • Waarmee start een statistische analyse?
    Een statistische analyse start met een dataset
  • Twee soorten stemplots (kwantitatieve variabelen):

    • stengel-en-blad plot

    Voorbeeld: 

     

    • rug-aan-rug plot

     


  • Cases
    Mensen, dieren of objecten
  • .... worden onderzocht en beschreven op basis van data
    Individuen

  • Exploratory data analysis
    Gebruikt grafieken en numerieke samenvattingen om de variabelen in de data te beschrijven
  • Hoe heet een verdeling met 1 piek?

    Unimodaal

  • Welke term gebruiken we  voor mensen?
    Individuen

  • Waarvoor gebruik je Bar Graphs en Pie charts
    Om verdelingen van categorische variabelen weer te geven
  • Wat is de modus?

    De waarde met de hoogste frequentie

  • Welke term gebruiken we voor alles behalve mensen?
    Cases
  • Waarvoor gebruik je stemplots en histogrammen
    Om de verdelingen van kwantitatieve variabelen weer te geven
  • Wat is een variabele?
    Een variabele is een kenmerk van een individu

  • Waarvoor gebruik je een histogram
    Frequenties of percentages met gelijke intervallen in de waardes
  • Wat zijn voorbeelden van variabelen?
    Sekse, leeftijd, lengte en gewicht
  • Wat doet een categorische variabele?
    Zij plaatst een individu in één of meer groepen of categorieën. Een voorbeeld is sekse
  • Wat is een kenmerk van een kwantitatieve waarde?
    Het heeft een numerieke waarden waarmee gerekend kan worden. Bijvoorbeeld: lengte (iemand van twee meter is twee keer zo lang als iemand van één meter)
  • Wat is een label?
    Een label is een speciale variabele die gebruikt wordt om data sets te onderscheiden van verschillende cases.
  • Wat zijn variabele labels?
    Variabele labels zijn samengesteld uit een paar woorden die beschrijven wan een variabele voortelt
  • Wat zijn waarde labels?
    Waarde labels zijn labels voor gecodeerde variabelen in onze dataset. Zo kan "geslacht" worden gecodeerd 0 (Mannen) en 1 (Vrouwen).
  • Distributie
    Wat is een spreadsheet?
    Een spreadsheet is een soort schema op bijvoorbeeld Microsoft Exel. Waarden van variabelen voor verschillende individuen en cases kunnen hierin verwerkt worden. Bv: je kunt voor alle deelnemers de lengte, het gewicht en het IQ noteren
  • Wat is een distributie van een variabele?
    Hieraan kan je zien welke waarden van een variabele bij individuen voorkomen en hoe vaak deze waarden voorkomen.
  • Hoe kunnen variabelen gemeten worden?
    Variabelen kunnen gemeten worden door middel van instrumenten. Bv: een intelligentietest is bijvoorbeeld een instrument om intelligentie te meten.
  • 1.1 Distributies grafisch weergeven
    Wat wordt er in een verkennende data-analyse (exploratory analysis) beschreven? 
    Hierin worden de belangrijkste kenmerken van een dataset beschreven.
     
  • Welke twee strategieën  kunnen gebruikt worden voor een data-analyse?
    • Onderzoek elke variabele eerst afzonderlijk. Vervolgens kijk je naar de relatie tussen de variabelen

    • Geef eerst grafisch de waarden van variabelen weer. Vervolgens kunnen er numerieke samenvattingen gemaakt worden van deze waarden
  • Wat laat de distributie van een categorische variabele zien? 

    Dit laat zien hoeveel van de onderzochte mensen een bepaalde waarde heeft gescoord (count). DIt kan ook vermeld worden d.m.v. percentages
  • Diagrammen voor categorische variabelen
    Hoe kan een distributie grafisch weergeven worden?
    Door gebruik te maken van een:

    • Staafdiagram (bar graph):
      De hoogte geeft weer hoe vaak bep. waarden voorkomen. De frequenties staan op de y-as en de lengtes v.d. staven dienen daar ook mee te corresponderen 

    • Circeldiagram (pie chart):
      Hiermee kun je zien of er meer vrouwen dan mannen mee gebben gedaan aan een onderzoek. Circeldiagrammen maken geen gebruik van schalen. De hoeveelheden worden uitgedrukt in percentages! Het geheel moet altijd op 100% uitkomen. 
  • Wat is het verschil tussen een staafdiagram en een cirkeldiagram?
    Staafdiagrammen zijn makkelijker te interpreteren en zijn flexibeler. 
    Bij een cirkeldiagram moet je op 100% uitkomen. Bij een staafdiagram kun je onafhankelijke groepen met elkaar vergelijken. 
  • Welk diagram wordt gebruikt voor kwantitatieve variabelen?
    Een stam-en-bladdiagram oftwel stemplot wordt hiervoor gebruikt.
  • Wat is een stam-en-bladdiagram?
    Een stam-en-bladdiagram geeft snel een beeld van de vorm van een distributie. Iedere waarde wordt in de oorspronkelijke vorm toegevoegd. 
  • Wanneer is het het handigst om een stam-en-bladdiagram te gebruiken?
    Als er sprake is van niet al te veel observaties (die allemaal groter dan nul zijn). 
  • Welke stappen moeten er uitgevoerd worden om een stam-en-bladdiagram te maken?
    Stap 1: 
    Alle waarden moeten opgedeeld worden in een stam en een blad. De stam is het eerste cijfer en het blad is het laatste cijfer (bij het getal 35 is dus de 3 de stam en 5 het blad). Stammen kunnen meerdere cijfers bevatten (bij het getal 135 is 13 de stam). EEN BLAD BESTAAT UIT ALTIJD MAAR UIT ÉÉN CIJFER.

    Stap 2:
    Vervolgens moeten alle stammen onder elkaar genoteerd worden. De kleinste stam moet bovenaan staan. Na deze stap moet een verticale lijn aan de rechterkant van de stammen getrokken worden.

    Stap 3:
    Tot slot moet het bijbehorende blad in elke rij rechts van de stam genoteerd worden. Er moet met het kleinste blad begonnen worden.
    stam-en-bladdiagram tekenen! 
  • Wat is een rug-tot-rugdiagram (back to back stemplot)
    Dit is een variant van de stam-en-bladdiagram. 
  • Wat kan je met een rug-tot-rugdiagram?
    Met deze diagram kunnen twee gerelateerde distributies vergeleken worden. De diagram maakt gebruik van gemeenschappelijke stammen. 
  • Wat kan je als voorbeeld in een rug-tot-rugdiagram verwerken?
    Het gewicht van mannen en vrouwen.
    De stammen van de gewichten staan dan in het midden en er worden twee lijnen (zowel links als rechts) vanaf de stammen getrokken. Aan de rechterkant kun je dan bv. de bladeren van de vrouwen noteren en aan de linkerkant de bladeren van de mannen opschrijven.
  • Wanneer is het niet handig om stam-en-bladdiagrammen en rug-tot-rugdiagrammen te gebruiken?
    Wanneer er een grote dataset gebruikt wordt.
  • Wat is het gevolg wanneer je het toch gebruikt?
    Het kost je veel tijd om elke waarde in de diagram te verwerken en het ziet er onoverzichtelijk uit. 
  • Wat kan je het beste gebruiken om het probleem van tijd en onoverzichtelijkheid tegen gaan? 
    Je kan het beste gebruik maken van:

    Splitting each stem: Elke stam door twee te delen, en de bladeren verdelen van 0 tot 4 bij de eerste stam, en 5 tot 9 bij de tweede stam

    Trimming: Je maakt de cijfers passend wanneer de geobserveerde waarden veel cijfers bevatten. Dit wordt gedaan door de laatste cijfers te verwijderen voordat een stam-en-bladdiagram gemaakt wordt. 

  • Wat gebeurt er bij een histogram?
    Bij een histogram worden de waarden van een variabele opgedeeld in groepen. Je mag zelf weten hoeveel groepen je maakt, zolang de groepen maar van dezelfde grootte zijn.  
Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.