Samenvatting Class notes - statistiek

Vak
- Statistiek 1
- Cornelisz
- 2020 - 2021
- Vrije Universiteit Amsterdam
- Psychologie
105 Flashcards en notities
1 Studenten
  • Deze samenvattingen

  • +380.000 andere samenvattingen

  • Een unieke studietool

  • Een oefentool voor deze samenvatting

  • Studiecoaching met filmpjes

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

Samenvatting - Class notes - statistiek

  • 1590962401 Week 1 HS 1

  • Wat is statistiek?
    Verzamelen van numerieke feiten
  • Wat is rationalisme?
    Logisch redeneren om te komen tot nieuwe kennis
  • Wat is empirisme?
    Zintuigelijk waarnemen en observeren om data met elkaar te vergelijken
  • Wat is het verschil tussen methodologie en statistiek? Noem 2 punten
    - Statistiek is gereedschapskist om onderzoek uit te kunnen uitvoeren.
    - Methodologie is de wijze waarop je onderzoek moet uitvoeren.
  • Wat is betrouwbaarheid? En hoe kan je de betrouwbaarheid controleren? Noem 3 puntne
    Betrouwbaarheid = ook wel consistentie of precisie genoemd, is de mate waarin meerdere metingen hetzelfde resultaat geven.

    Betrouwbaarheid controleren:

    - Test-hertest betrouwbaarheid = twee metingen van hetzelfde gedrag op verschillende tijdstippen.
    - Interbeoordelaars betrouwbaarheid = minimaal twee verschillende waarnemers/beoordelaars meten hetzelfde gedrag.
    - Interne consistentie = onderlinge samenhang van afzonderlijke items van een meet instrument.
  • Wat is validiteit? En wat zijn twee bedreigingen van de validiteit?
    Validiteit = juistheid/meet de test wat het beoogt te meten

    Bedreigingen validiteit:
    - Afwijking meetapparatuur;
    - Systematische fouten.
  • Wat is statistiek? Je hebt beschrijvende en inferentiele statistiek. Beschrijf het verschil van deze twee soorten
    Statistiek = is de wetenschap van het verzamelen, organiseren en interpreteren van numerieke feiten, die gegevens of data worden genoemd.

    Twee soorten statistiek:
    - Beschrijvende statistiek = je hebt informatie over iedereen in de groep waarover je een conclusie wilt trekken. Het is een numerieke samenvatting (dataset) van de steekproef of populatie in nummers, tabellen of grafieken.
    - Inferentiële statistiek = conclusie trekken / voorspelling doen over een populatie op basis van de informatie verkregen uit een steekproef. Meer onzekere versie, omdat je niet zeker weet of de populatie eruit ziet zoals je steekproef.
  • Je hebt 3 soorten statistische methodes. Welke zijn dit?
    - Design
    - Beschrijvende statistiek
    - Inferentiële statistiek.
  • Wat is een populatie? En waar bestaat dit uit (vul 3x aan)
    Populatie = de totale set van deelnemers, relevant voor de onderzoeksvraag.
    - Parameter = de numerieke samenvatting van de gehele populatie (populatiegrootheid).
    - Populatie gemiddelde = μ
    - Populatie standaarddeviatie = σ2
  • Wat is een sample? En waar bestaat dit uit? Vul 2x aan
    Sample = de steekproef, deel van de populatie waarover het onderzoek gegevens verzamelt. Op basis van de steekproef wordt een uitspraak gedaan over de gehele populatie, het is daarom van belang dat de steekproef representatief is. Dat betekent dat de kenmerken uit de populatie, bijvoorbeeld de verdeling in leeftijd en opleidingsniveau, terugkomen in de steek- proef.

    • Steekproef gemiddelde = x met streepje erboven
    • Steekproef standaarddeviatie = s Observatie = de waarde uit een bepaalde proef (of op een bepaald tijdstip) van een bepaalde variabele.




  • Voorbeeld
    “Hoeveel mensen geloven in de hemel?”
    Beschrijvende statistiek = 85% van de 1326 volwassenen antwoordde ja in de vragenlijst. Nu wil je dit niet alleen weten van de 1326 volwassenen maar van de gehele populatie volwassenen.
    Inferentiële statistiek = 85% van de proefpersonen zei ja, hier moet een foutmarge van 2% over berekent worden. Dus van de gehele populatie volwassenen zal het percentage dat gelooft in de hemel vallen tussen 83% en 87%.
    Parameter = het percentage van de populatie dat gelooft in de hemel. De inteferentie van de paramater is gebaseerd op de beschrijvende statistiek - het percentage van de 1326 proef- personen dat met ja heeft geantwoord, namelijk 85%. 
  • Wat is kansrekening? Waar gaat het vanuit? Noem tevens 3 punten




    Kansrekening = gaat veelal uit van deductie = voorspellingen doen over specifieke gevallen, je weet al hoe de wereld eruit ziet.
    - Algemeen —> specifiek.
    - Populatie —> steekproef.
    - Model —> data. 
  • Wat is statistiek? Waar gaat het vanuit? Noem tevens 3 punten




    Statistiek = gaat veelal uit van inductie = je hebt een hypothese en daarop ga je een steekproef afnemen.
    - Specifiek —> algemeen.
    - Specifiek —> algemeen.
    - Steekproef —> populatie.
    - Data —> model. 
  • Noem drie overeenkomsten tussen kansrekening en statistiek. Wat is de beslisregel?
    - Rekenen met toeval (randomness).
    - Statistische technieken worden gebruikt om de hele populatie te beschrijven (bijvoorbeeld gemiddelde leeftijd).
    - Sommige statistische technieken maken eerst bepaalde aannames over de populatie om vervolgens op basis van een steekproef te bepalen hoe onwaarschijnlijk het is dat de aannames opgaan.

    Beslisregel
    = falsificatie —> het trekken van conclusies aangaande een populatie op basis van een steekproef zijn gebaseerd op weerleggen.
  • 1591048801 Week 1 HS 2

  • Wat is een variabele? Je hebt een categorische variabele en een kwantitatieve variabele. Leg uit




    Variabele = een eigenschap (karakteristiek) waarin we geïnteresseerd zijn en die verschillende waarden heeft voor verschillende individuen, zoals leeftijd en geslacht. Het is alles wat in onderzoek gemeten, uitgevraagd of bijgehouden wordt.


    Twee soorten variabelen:
    - Categorische variabele = wanneer de meetschaal bestaat uit categorieën/groepen. Bijvoorbeeld: burgerlijke status, muziekgenre of geloof —> nominaal of een ordinaal. Worden vaak kwalitatieve variabele genoemd.
    - Kwantitatieve (numerieke) variabele = wanneer de meetschaal numerieke waarden heeft die verschillende grootte van de variabele vertegenwoordigen. Bijvoorbeeld: leeftijd, aantal broers/zussen, inkomen —> interval en ratio. 
  • Je hebt 4 soorten meetschalen: nominaal, ordinaal, interval en ratio. Leg uit en beschrijf tevens of ze categorisch zijn of kwantitatief




    - Nominaal (categorisch) = ongeordend, kwalitatieve classificatie zonder ordening. Je kunt er de identiteit
    van een variabele vergelijken met de identiteit van een andere variabele. Bijvoorbeeld: ja/
    nee, man/vrouw, kleuren.
    - Ordinaal (categorisch)= geordend, kwalitatieve classificatie met een logische ordening. De afstand
    tussen de opeenvolgende waarden hoeft niet gelijk te zijn. Bijvoorbeeld: schoolniveau
    (mavo/havo/vwo) of het KNMI weeralarm (geen, code geel, code oranje en code rood).
    - Interval (kwantitatief) = gelijke afstand of interval tussen opeenvolgende waarden. Er is geen echte nul,
    de 0 betekent ‘niks’. Bijvoorbeeld: schoenmaat, geboortejaar, graden Celcius.
    - Ratio (kwantitatief) = gelijke afstand of interval tussen opeenvolgende waarden én een absoluut nulpunt.
    Nul stelt “geen” voor. Bijvoorbeeld: gewicht of afstand.
  • Het bereik waarop de variabelen worden gemeten is een beetje een spel tussen theorie en wat we in de praktijk zien. Je hebt hierbij een discrete en continue variabele. Wat houdt dit in?
    - Discrete variabele = een variabele waarbij de mogelijke waarden een reeks afzonderlijke getallen vormen, zoals (0,1,2,3). Het is een meeteenheid die ondeelbaar is, het zijn integere (hele) getallen. Bijvoorbeeld: het aantal broers/zussen —> kwantitatieve of categorische variabelen.
    - Continue variabele = geen variabele die oneindig deelbaar is. Ze zijn continue meetbaar. Bijvoorbeeld: leeftijd, gewicht, lengte —> kwantitatieve variabelen
  • Inferentiële statistiek = op basis van een steekproef uitspraken doen over een gehele populatie. De kwaliteit van de gevolgtrekking is afhankelijk van hoe goed de steekproef de populatie representeert. Hoe kan je een optimaal steekproef krijgen en wat is het doel hiervan?




    - Randomization = het mechanisme voor het bereiken van een goede steekproef-
    representatie.
    - Doel = betrouwbare en valide uitspraken over populatie op basis van een steekproef.
    Steekproefgrootheden dienen dan niet te verschillen van populatiegrootheden. 
  • Het verschil tussen steekproefgrootheid en populatiegrootheid kan komen door.. (vul 3x aan)
    - Natuurlijke variatie (toeval) tussen steekproeven.
    - Problemen/fouten met/binnen de steekproef.
    - Steekproef grootte (n) = het aantal onderwerpen in een steekproef.
  • Steekproefproblemen bij inferentiele statistiek (validiteitsprobleem) zijn... (vul 4x aan)




    - Steekproeffout (sampling error) —> toevallige steekproefverschillen.
    - Steekproefvertekening (sampling bias) —> selectieve werving.
    - Meetfout (response bias) —> incorrect antwoord.
    - Selectieve respons (non-respons bias) —> selectieve deelname. 
  • Wat houdt een steekproeffout (sampling error) in? Hoe kan het verkleind worden?




    = geeft aan hoeveel de statistiek verschilt van de parameter die wordt voorspelt vanwege de manier waarop resultaten van nature van steekproef tot steekproef verschillen (foutmarge). 
    Kan verkleint worden door een hele grote steekproef te ondervragen. 
  • Wat houdt een steekproefvertekening in (sampling bias)?. Het bestaat uit een probability sampling en nonprobability sampling. Licht toe. Wat houdt undercoverage in?




    Steekproefvertekening = treedt op bij het gebruik van niet waarschijnlijke steekproeven, zoals de selectiebias die onlosmakelijk samengaat met vrijwillige steekproeven.
    - Probability sampling = methoden waarbij de waarschijnlijkheid dat een bepaalde subgroep
    uit de populatie zal worden geselecteerd bekend is —> wordt gebruikt door inferentiële
    statistiek.
    - Nonprobability sampling = methoden waarbij de waarschijnlijkheid dat een bepaalde
    subgroep uit de populatie zal worden geselecteerd niet bekend is. Volunteer sampling = de meest voorkomende nonprobability sampling methode. Hierbij nemen de proefpersonen vrijwillig deel aan een steekproef.
    Undercoverage = het ontbreekt aan vertegenwoordiging van sommige groepen in de popultatie. Bijvoorbeeld: een telefonisch interview, dit zal niet gaan voor mensen in de gevangenis of daklozen. 
  • Wat is een meetfout (response bias)?




    Treedt op wanneer het onderwerp een onjuiste reactie geeft, of de vraagformulering / de manier waarop de interviewer de vraag stelt verwarrend of misleidend is. 
  • Wat houdt selectieve respons (non-response bias) in? En wat is de oplossing?




    Selectieve respons (non-response bias) = treedt op wanneer sommige proefpersonen niet bereikt kunnen worden of weigeren deel te nemen of sommige vragen niet willen beantwoorden.
    Oplossing = een aselecte (of andere probabilistische) steekproef van voldoende omvang die informatie (data) oplevert over iedereen die benaderd is, met correcte responses voor alle subjecten op alle items.
  • Wat houdt een enkelvoudige aselecte steekproef? Waarom is het goed? Beschrijf tevens of reliability en validiteit laag/hoog zijn.




    = elke combinatie van deelnemers heeft evenveel kans om de steekproef te vormen.

    Voorbeeld:
    Simple random sample van n= 1 student, iedereen van de 60 studenten heeft evenveel kans om geselecteerd te worden —> vaak random sample genoemd.
    Goed omdat: eerlijkheid (iedereen evenveel kans), dit verkleint de kans dat de steekproef op een bepaalde manier ernstig bevooroordeeld is, wat leidt tot onnauwkeurige conclusies over de populatie.
    Methode voor het selecteren van een random sample:
    1. nummeren van onderwerpen in een steekproefkader (sampling frame) = lijst van alle onderwerpen in een populatie.
    2. willekeurig/aselect een steekproef van n personen trekken;
    3. de onderwerpen waarvan de nummers worden gegenereerd nemen deel aan de
      steekproef.
    Reliability is laag — validiteit is hoog. 
  • Wat is een systematische aselecte steekproef? Noem tevens de 3 stappen




    Systematische aselecte steekproef = niet elke combinatie van deelnemers heeft evenveel kans om de steekproef te vormen, het selecteert een onderwerp aan het begin van het steekproefkader, slaat namen over en selecteert een ander onderwerp, slaat namen over en selecteert het volgende onderwerp, enzovoort. Het aantal namen dat in elke fase wordt overgeslagen, is afhankelijk van de gekozen steekproefgrootte.
    Steekproefgrootte = n, populatiegrootte = N, overgeslagen nummer = k. Methode voor systematic random sampling:
    1. stel steekproefkader op;
    2. bepaal de stapgrootte k, tussen onderwerpen
    3. kies de eerste deelnemer aselect en kies vervolgens steeds de persoon waar de stapgrootte op uitkomt. Stapgrootte k=N/n.


    Voorbeeld:
    Je wilt een systematic random sampling over 100 students uit een populatie van 30.000 studenten uit de campuslijst. Dan is n= 100, N= 30.000, dus k= 30.000/100 = 300. De population size = 300 keer de sample size, dus moet je van iedere 300 studenten er één selecteren. Je selecteert één student random, door gebruik te maken van willekeurige getallen, uit de eerste 300 studenten. Vervolgens selecteer je elke 300ste student na de willekeurig geselecteerde student. 
  • Wat houdt een gestratificeerde steekproef in? Leg tevens het verschil uit tussen proportioneel en disproportioneel. En beschrijf de 3 stappen




    Gestratificeerde steekproef = verdeelt de populatie in afzonderlijke groepen, strata genoemd, en selecteert vervolgens een enkelvoudige aselecte steekproef uit elke stratum.
    • Proportioneel = als de steekproefverhoudingen in de steekproef gelijk zijn als die in de gehele populatie.
    Disproportioneel = als de steekproefverhoudingen in de steekproef verschillen van de
    populatieverhoudingen.


    Methode voor gestratificeerde steekproef:
    1. stel steekproefkader op;
    2. verdeel de populatie in strata —> bijvoorbeeld jongens/meisjes;
    3. trek aselect uit ieder stratum —> bijvoorbeeld 2 jongens/ 2 meisjes trekken, handig
      wanneer er duidelijke categorieën zijn en wanneer deze verschillen in omvang. Het aantal moet representatief zijn. 
  • Wat houdt een cluster steekproef in? Leg tevens de 4 stappen uit.




    Cluster steekproef = de populatie wordt verdeelt in clusters, bijvoorbeeld stadsblokken. Selecteer een enkelvoudige aselecte steekproef van de clusters. Gebruik de onderwerpen in die clusters als voorbeeld voor de gehele populatie.
    Methode voor cluster steekproef:
    1. stel steekproefkader op;
    2. verdeel populatie in clusters —> bijvoorbeeld scholen;
    3. trek aselect een aantal clusters;
    4. kies alle subjecten van de clusters voor je steekproef —> handig wanneer het moeilijk is
      om alle clusters te bereiken voor een steekproef. 
  • Wat is het verschil tussen gestratificeerde steekproeven en cluster steekproeven?




    = clusters worden niet met elkaar vergeleken en strata wel. 
  • Wat is een getrapte steekproef? Leg tevens de 4 stappen uit




    Getrapte steekproef = gebruikt combinaties van steekproefmethodes. Een steekproef kiezen van clusters.
    Methode voor getrapte steekproef:
    1. stel steekproefkader op;
    2. verdeel populaties in clusters —> bijvoorbeeld scholen;
    3. trek aselect een aantal clusters;
    4. trek aselect binnen gekozen clusters —> handig wanneer het moeilijk is om alle clusters
      te bereiken voor een steekproef en het duur is om heel veel subjecten te ondervragen. 
  • Leg het verschil uit tussen een sample survey, experiment en een observatie studie.




    - Sample survey = een steekproef van mensen uit een populatie selecteren en hun interviewen.

    - Experiment =
    het doel van de meeste experimenten is om de antwoorden van proefpersonen op een bepaalde uitkomstmaat te vergelijken, onder verschillende condities. Deze condities zijn niveaus van een variabele dat de uitkomst kunnen beïnvloeden. De onderzoeker heeft de experimentele controle om subjects toe te wijzen aan de condities.
    Treatments = de condities (wel of geen behandeling) in een experiment.
    • Experimenteel design = een plan voor het toewijzen van een onderwerp aan een behandeling. Goede experimentele designs gebruiken randomisatie om te bepalen welke proefpersoon welke behandeling krijgt. Dit vermindert bias en stelt ons in staat om statistische inferenties te gebruiken om voorspellingen te doen.

    - Observatie studie = de onderzoekers meten de antwoorden van proefpersonen op de variabelen die van belang zijn, maar hebben geen experimentele controle over proefpersonen. • Een gerandomiseerd experiment houdt de te vergelijken groep in evenwicht met andere factoren, daarom kunnen we het gebruiken om oorzaak en gevolg te bestuderen. 
Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.

Samenvatting - Class notes - Statistiek

  • 1522533600 Week 1

  • Wat is beschrijvende statistiek en wat is inferientiele statistiek?
    Beschrijvende statistiek: samenvatting van de verkregen data
    Inferentiele statistiek: uitspraken en voorspellingen doen over hele populatie op basis van de verkregen data.
  • Vb. beschrijvende statistiek:
    Klagen oudere werknemers meer op het werk dan jongere werknemers?
    “Internationaal onderzoek (Britse nationale bureau voor de statistiek) laat zien dat ouderen juist gelukkiger zijn dan jongeren. Geluk ontwikkelt zich via een U-curve: na 25 jaar neemt het af, en na 50 jaar stijgt het weer”.
  • Wanneer is een uitkomst significant?
    x
  • Vb. inferentiële statistiek:
    Ouderen presteren slechter? (ziekteverzuim)
    Ouderen (N=50): gemiddeld 6,8 dagen (SD = 1,2) Jongeren (N=50): gemiddeld 7,2 dagen (SD = 1,4)
    Ligt dit verschil wel aan iemands leeftijd? Hoe controleer je voor “verstorende variabelen”? --> zie afbeelding.
  • Welke type variabelen zijn er?
    Categorische variabelen: 
    -Nominaal: de variabele heeft meerdere groepen, maar is geen rangordening. Bijvoorbeeld: religie, studierichting, nationaliteit. 
    -Ordinaal: de groepen hebben een rangordening, maar geen vaste afstand. Bijv. leger, opleidingsniveau.
    Kwantitatieve variabelen = interval/ratio: 
    -Discreet variabele waarbij slechts bepaalde waarden kunnen voorkomen, bijv. alleen hele getallen 0, 1, 2, 3 etc., voorbeeld: aantal kinderen of huisdieren. 
    -Continue variabele waarbij oneindig veel mogelijkheden zijn, zoals tijd, afstand en gewicht. 
  • Hoe heet een "speciaal geval" van een nominale variabele?
    Dichotoom (dummyvariabele): bijv. geslacht. Dit is een variabele waarbij het kenmerk 0 (vrouw) en 1 (man) is.
  • Wat zijn categorische data?
    Frequentietabel, taartdiagram, staafdiagram.
  • Wat zijn kwantitatieve data?
    Dot-plot (puntdiagram), stem-and-leaf plot en histogram.
  • Welke centrummaat is het meest gevoelig voor outliers? (Modus, mediaan of gemiddelde?)
    Gemiddelde.
  • Bij een grote spreiding zijn er grote afwijkingen en bij een kleine spreiding zijn er kleine afwijkingen.
  • De standaarddeviatie geeft aan hoeveel de data gemiddeld afwijkt van het gemiddelde. Hiermee beschrijf je dus de spreiding van de data, je kunt met de standaarddeviatie de data makkelijk vergelijken. Som standaarddeviatie:
    1e: gemiddelde uitrekenen. 
    2e: uitrekenen hoeveel elke observatie van het gemiddelde afligt. Dat doe je in het kwadraat en dan tel je alles bij elkaar op. 
  • Empirical Rule
    Alleen als de verdeling klokvormig is dan:
    -Ligt ongeveer 68% van de observaties 1 standaarddeviatie van het gemiddelde af, dus gemiddelde + standaarddeviatie en gemiddelde - standaarddeviatie.
    -Ligt ongeveer 95% van de observaties 2 standaarddeviaties van het gemiddelde af= gemiddelde + 2 standaarddeviaties en gemiddelde - 2 standaarddeviaties.

    -Ligt ongeveer 99% van de observaties 3 standaarddeviaties van het gemiddelde af = gemiddelde + 3 standaarddeviatie en gemiddelde - 3 standaarddeviaties.
  • Wat is de z-score?
    Die drukt uit hoeveel standaarddeviaties een observatie van het gemiddelde ligt:


    observatie - gemiddelde / standaarddeviatie 
  • Wat zijn 'percentielen'?
    Geven aan hoeveel procent van de observaties op of onder een bepaald punt ligt. 
    Het p-de percentiel is een waarde waarbij p procent van de observaties op of onder die waarde ligt. 
    VB: het 50e percentiel is 30 jaar. 
    50% van de observaties is 30 jaar op kleiner
    Ander VB: als het 90e percentiel 50 jaar is, dan is 90% van de observaties gelijk aan of kleiner dan 50 jaar. 
  • Wat is IQR en Q1 , Q2 en Q3?
    Q1= 25e percentiel
    Q2=50e percentiel
    Q3=75e percentiel

    IQR= middelste 50% van de data = Q3-Q1.
  • Wanneer is een observatie een outlier?
    Als het meer dan 1,5 keer de IQR onder het 1e of boven het 3e kwartiel ligt.
  • Associatie tussen 2 variabelen = de waarde van de ene variabele hangt samen met de waarde van de andere variabele. Bijv. wel/niet roken en sterftekans.
    Causaliteit= de onafhankelijke variabele (X) heeft invloed op de afhankelijke variabele Y. Dus X (uren besteed aan studie --> tentamencijfer). 
  • Als je de associatie tussen 2 kwantitatieve variabelen (interval/ratio), wil weergeven maak je een scatterplot.
  • Als je een rechte lijn kunt trekken door een scatterplot, dan bestaat er een lineair verband tussen X en Y. De correlatie drukt de sterkte van dit lineaire verband uit.
    Hoe dichter r bij de 0 ligt des te zwakker het verband.
    Hoe dichter r bij -1 of +1 ligt, des te sterker is het verband. 

    De sterkte van de correlatie is onafhankelijk van de meeteenheden. 
  • Wanneer is een verband zwak/matig/sterk?
    0,1 = zwak
    0,3 = matig
    0,5 = sterk
  • Wat is een regressielijn?
    Je maakt een regressielijn zodat je met de waarde van X, Y kunt voorspellen. 
    Formule: y=a+bx of terwijl= Y= B0 + B1 * X
  • a= intercept = de waarde van Y als X de waarde 0 aanneemt.
    b= slope = de helling van de lijn, dus de hoeveel die Y toeneemt als X 1 waarde toeneemt.
  • Wat is een residu?
    Het verschil tussen de echte en de geschatte waarde.
  • Lineair regressiemodel= Y= B0 + B1 * X
    Stel: Y=inkomen, X=geslacht (0=vrouw en 1=man)
  • Wat is extrapolatie?
    Het uitbreiden van een reeks getallen met punten die buiten de reeks liggen.



  • Wat is bij een factoranalyse het synoniem voor de term “dimensies”?
    Factoren.
  • Welke criteria is/zijn noodzakelijk voor het vaststellen van causaliteit?
    1. alternatieve verklaringen zijn uitgesloten.
    2. de oorzaak gaat vooraf aan het gevolg
    3. de variabelen correleren met elkaar.
  • Wat is kenmerkend voor een dichotome variabele?
    Hoewel een dichotome variabele eigenlijk nominaal is, kun je er toch zinvol een gemiddelde van uitrekenen. Neem bijvoorbeeld een variabele geslacht waarbij 0 voor man staat en 1 voor vrouw. Een gemiddelde van 0,6 lezen we dan als 60% vrouwen.
  • Wat houdt een lineaire relatie in?
    Lineair staat voor  rechtlijnig of rechtevenredig. Bij een lineaire relatie zullen de observaties in een scatterplot ongeveer de rechte lijn volgen!
Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.