Summary Testtheorie

-
202 Flashcards & Notes
5 Students
  • This summary

  • +380.000 other summaries

  • A unique study tool

  • A rehearsal system for this summary

  • Studycoaching with videos

Remember faster, study better. Scientifically proven.

PREMIUM summaries are quality controlled, selected summaries prepared for you to help you achieve your study goals faster!

Summary - Testtheorie

  • 1 samenvatting studeerslim deel 1 (h2 t/m6, 8)

  • H2 Wat zijn de onderdelen van een test?
    - testmateriaal: testboekje, puzzelstukjes etc. 
    - testformulier: antwoorden, reacties of gedragsgegevens
    - testhandleiding: testinstructie, verwerkingsprocedure, normtabellen, bespreking wetenschappelijke kwaliteiten
  • H2 wat zijn de kenmerken van een test? (6)
    1. effeciënt: enkel gericht op het meten van het hypothetisch construct zonder andere storende factoren 
    2. standaardisatie: de testprocedure is voor alle respondenten gelijk en kent dezelfde instructie, tijdslimiet en condities. Zo kan je testen met elkaar vergelijken
    3. normering: zorgt voor vergelijkbaarheid van de testscores.
    4.  objectiviteit: het maakte niet uit wie de beoordelaar is en de testprocedure is open en reproduceerbaar = KAPPA
    5. betrouwbaar: mag niet uitmaken op welk tijdstip iemand gemeten wordt en er is een hoge mate van dezelfde scores bij herhaalde meting    
    6. validiteit: meet de test wat hij zou moeten meten
  • H2 er zijn vier schalen die gebruikt kunnen worden bij het toekennen van een score aan testpersoon, welke?
    - nomimaal: vindt alleen categorisering plaats. De getallen dienen alleen om categorieën of objecten te onderscheiden. vb man/vrouw
    - ordinaal: rangorde. Onderscheid te maken, maar kunnen geen rekenkundige bewerkingen op de getallen worden uitgevoerd. vb vmbo, havo, vwo
    - interval: verschillende posities zijn geordend en de afstanden tussen de posities hebben betekenis. Daardoor kunnen wel rekenkundige bewerkingen op de getallen worden uitgevoerd. Vermenigvuldigen is niet mogelijk vanwege het ontbreken van een absoluut nulpunt. vb temp
    - ratio: intervalschaal met absoluut nulpunt. Vermenigvuldigen mogelijk. Vb lengte, schoenmaat, etc.
  • H2 Wat zijn de stappen om tot een meting te komen bij psychologische eigenschappen?
    1. identificatie: wat is de theorie achter de eigenschap?
    2. operationalisering: de specificaties van de operaties die nodig zijn om de eigenschap te meten
    3. onderzoek en kwantificering: van reacties van verbale uitdrukkingen of gedragingen naar getallen. Kijken naar afstand tussen de verschillende reacties etc. 
    4. terugkoppeling naar de theorie: meet ik wat ik wil meten?
  • H2 Wat is de definitie van een test?
    systematische classificiatie - of meetprocedure, waarbij het mogelijk is een uitspraak te doen over een of meer empirsch-theoretisch gefundeerde eigenschappen van de onderzochte of over specifiek niet-testgedrag, door uit te gaan van een objectivieve verwerking van reacties van hem, in vergelijking tot die van anderen, op een aantal gestandaardiseerde, zorgvuldig gekozen stimuli
  • H2 welke 3 toepassingsmogelijkheden zijn er bij een test?
    - beoordeling van een individu (voorspellingen doen, keuzemogelijkheden, sterke en zwakke kanten ontdekken, resultaten vergelijken, therapie en een beschrijving van de onderzochte) 
    - beoordeling van groepen (verschillen tussen groepen) 
    - beoordeling van invloed van situaties en methoden (bv interventie) (effectiviteit etc.)
  • H2 Wat zijn de doelen van een test?
    - voorspellen 
    - classificeren
    - beschrijven

    vaak in een vergelijking
  • H2 Wat zijn de stappen bij het operationaliseren (=meetbaar maken)?
    1. het domein van gedragingen wordt gedefinieerd bij een eigenschap. Kijken naar welke gedragingen bij het begrip horen. 
    2. Welke stimuli kan ik inzetten om reacties uit te lokken om dit domein te testen
  • H3 Het belangrijkste onderscheid dat te maken is bij testgedrag is het onderscheid tussen ... en ...
    prestatieniveau en gedragswijze
  • H3 Wat verstaan we onder prestatieniveau?
    wordt van de onderzochte persoon een maximale prestatie gevraagd.Testvragen worden goed of fout beantwoord en er is een duidelijke norm voor wat goed en fout is. 
    vb. meerkeuzevragen, het is goed of fout
  • H3 wat verstaan we gedragswijze?
    is vooraf geen bekende goed/fout sleutel beschikbaar. Het gaat hier vooral om de vraag hoe iemand het doet.
  • H3 Welke tests zijn er voor gedragswijze?
    - observatietest 
    - somato-fysiologische methoden
    - zelf beoordelingen
    - kwalitatieve prestatietests
  • H3 Welke twee vallen onder een observatietest?
    - individuele observatietests
    - groepsobservatietests
  • H3 Welke 2 vallen er onder somato-fysiologische methoden?
    morfologisch onderzoek: kijk je fysiek, reactie. Validiteit is gering 
    fysiologisch onderzoek: DNA test, leugendetector, eye tracker
  • H3 Welke 4 vallen er onder zelfbeoordelingen?
    1. interessetests waarden: beroepskeuze test
    2. attitudetest: gedrag
    3. biografische vragenlijsten: wat je deed
    4. persoonlijkheidsvragenlijsten: karaktereigenschappen
  • H3 kwalitatieve prestatietests zijn onder te scheiden in 2 soorten tests, welke?
    niveautests voor gedragswijze 
    projectietest: heel onbetrouwbaar
  • H3 Welke 5 vallen onder niveautest voor gedragswijze?
    - experimentele tests 
    - motoriektest
    - intelligentietests
    - karaktertest: hoe iemand is 
    -cognitieve/perceptuele stijlen
  • H3 Welke 6 vallen er onder projectietests?
    - perceptie test: vb inktvlek testen 
    - interpretatie test: welk verband leg je
    - expressie test   
    - constructie test
    - associatie test: zin aanvullen 
    - keuze test: vb 3 beelden, welke kies je
  • H3 welke tests is prestatieniveau te onderscheiden? (4)
    - enkelvoudige algemene niveautest
    - veelvoudige algemene niveautest
    - speciale niveautest
    - vorderingstest: voor en nameting, ga je vooruit?
  • H3 In welke tests is een enkelvoudige algemene niveautest te onderscheiden?
    - individuele ontwikkelingstests: vergelijken leeftijdsgenoten
    - individuele intelligentietest voor volwassenen
    - algemene collectieve intelligentietest: klassikaal afnemen
  • H3 In welke test zijn veelvoudige algemene niveautests te onderscheiden? (2)
    - testbatterijen voor intelligentiefactoren 
    - testbatterijen voor geschiktheden: kan je bepaalde vaardigheden uitoefene
  • H3 In welke tests zijn speciale niveautests te onderscheiden?
    - test voor speciale intelligentiefactoren: naar 1 aspect hoe goed/snel je bent
    - test voor speciale geschiktheden: kan je goed tegen stress
    - test voor speciale niet-intelligentiefactoren
  • H3 waar kan nog meer een onderscheid in gemaakt worden bij tests?
    - individuele test en groepstest: instructie en afneming
    - snelheidstest en niveautest:  instructie en afneming
    - cultuurvrije en niet-cultuurvrije test: bestaat niet!
    - directe test en indirecte test: testvragen
    - vrije antwoortest en keuze-antwoordentest: testvragen
  • H4 van de respondent gevraagde activiteiten kunnen zijn/ items kunnen onderscheiden worden in?
    - theoretische opdrachten: meten vaak cognitieve aspecten en vaardigheden
    - stellingen: aangeven in hoeverre van toepassing, meten vaak persoonlijkheidstrekken, opinies, houdingen en voorkeuren 
    - vragen: meten vaak opinies, houdingen en voorkeuren, vaak ja/nee
    - praktijkproeven: meten vaak capaciteiten en vaardigheden vb rijexamen
  • H4 bij het samenstellen van een test lijkt het stellen van open/gesloten vragen vaak de voorkeur te hebben
    open (essayvragen)
  • H4 wat zij nadelen bij het stellen van open vragen?
    - beoordelen en coderen van de antwoorden is een tijdrovende bezigheid/lagere objectiviteit
    - respondenten begrijpen niet altijd wat er met de vraag bedoeld wordt.
    - niet alle respondenten zijn even goed in staat om hun gedachten op papier te zetten
  • H4 wat zijn nadelen bij gesloten vragen (geprecodeerde items)?
    - het bedenken van antwoordalternatieven is een moeilijkheid (vereist vooronderzoek)
    - door gissen kan een respondent veel goede antwoorden verkrijgen (hiervoor kan wel gecorrigeerd worden)
    - slechts 'weetjes' worden getest, die overigens niet via reproductieproces, maar herkenningsproces getest worden
  • H4 wat zijn drie voorbeelden van geprecodeerde items? (gesloten vragen)
    1. kiezen: abc 
    2. rangschikking (leuk - minder leuk)
    3. toeschrijving/matching: paren van begrippen uit twee rijen namen, feiten, etc.
  • H4 wat is een belangrijk bezwaar tegen toeschrijving/matching?
    keuzes kunnen niet onafhankelijk van elkaar worden gemaakt. Deze items worden voornamelijk gebruikt voor prestatieniveautests.
  • H4 Waar of niet waar? 

    in tests voor gedragswijze is een item vaak een uitspraak waarbij de respondent door op een gegeven schaal een kruisje te zetten, kan aangeven in welke mate hij het met de uitspraak eens is.
    waar
  • H4 Wat is een vorm van adaptief testen?
    testen per computer, deze neemt de test af en doet de scoring. Na elk item schat de computer de vaardigheid en selecteert daarop. Ongeveer de helft aan items is nodig vergeleken met een standaard test.
  • H4 Wat is een nadeel van adaptief testen met de computer?
    het is kostbaar
  • H4 Bij prestatietest is er een onderscheid te maken tussen een ... en .... Wat betekenen deze tests?
    snelheidstest: gaat het om de vraag hoeveel opgaven de onderzochte in een vastgestelde tijd kan maken
    niveautest: de moeilijkheidsgraad varieert van makkelijke vragen die iedereen weet tot moeilijke vragen die bijna niemand weet. Respondenten krijgen veel tijd om tot een antwoord te komen.
  • H4 Waar of niet waar?

    reacties van respondenten zijn in eerste instantie kwalitatief van aard. Deze reacties moeten gekwantificeerd worden. Door middel van berekeningen op de scores kan worden vastgesteld of er een gewenste systematiek in het gedrag aanwezig is. Dan heeft de test goede meeteigenschappen.
    waar
  • H4 Wat zijn dichotome items?
    Items met maar 2 mogelijkheden (goed/fout). Het juiste antwoord wordt dan een 1 aan toegekend en aan het onjuiste antwoord 0.
  • H4 wat zijn polytome items?
    items met ten minste drie antwoordcategorieën. De richting van het toekennen van de cijfers, hangt af van de formulering van de stam van het item. Belangrijk is dat voor elk item in een test dezelfde scores krijgen toegewezen zodat alles even zwaar meetelt.
  • H4 testconstructieonderzoek kent 2 fasen waarin empirisch onderzoek wordt gedaan naar de kwaliteit van de items, welke?
    1. vooronderzoek: kleine steekproef (n=200), hoeft niet representatief te zijn. De vragen die niet goed functioneren worden eruit gehaald (bijv als je zwakke groep hebt en ze begrijpen de vragen, dan zijn de items goed)
    2. hoofdonderzoek: grote, representatieve steekproef (n=500-2000). Om de normverdeling goed te kunnen inschatten moet elke deelgroep van de populatie goed gepresenteerd worden. Hier vallen soms de items weg, maar wel minder. Hoofddoel is het vaststellen van de gehele test ivm gebruik ervarin in beoogde populatie
  • H4 wat is goed voor dichtome items? en voor polytome items?
    1. voor dichotome items is het goed als het grootste deel het juiste antwoord heeft gegeven en de rest van de items ongeveer evenveel gekozen zijn. 
    2. voor polytome items geldt dat het goed is als alle antwoordcategorieën benut worden. Er mag wel een antwoord bovenuit springen, maar er hoeft niet een onwsij scheve verdeling te zijn (vb 0,1/0,1/0,2/0,5/0,1)
  • H5 welke aspecten van standaardisatie kennen we?
    - objectieve testsituatie: in max gelijke omstandigheden testen. Proefleider moet zich houden aan goed uitgewerkte instructie. Ook weren ongewenste omgevingsinvloeden. 
    - gedrag van de proefpersoon: situatie waarin onderzochte zich verkeert zo constant mogelijk. Controleerbaar: goed uitgeslapen, niet in sterk opgewonden toestand testen. Duidelijke instructies bieden helpt met het begrip van de mensen
    - gedrag van de proefleider: voldoende ervaring, testinstructie goed kennen en volgen
  • H5 waar of niet waar? 

    een hoge overeenstemming leidt niet automatisch tot een goede validiteit
    waar
  • H5 De voornaamste zorg bij de scoring van meerkeuzevragen betreft de nauwkeurigheid en de efficiëntie. Welke 3 mogelijkheden zijn er?
    1. handscoring: het is geboden het tweemaal uit te voeren gezien de kans op fouten en daardoor kost het ook veel tijd. 
    2. zelfscoring: redelijk verouderd. Wel sneller en effeciënter. Corrector hoeft alleen fouten/goeden nog maar te tellen.
    3. machinescoring: computer is het snelst en het efficiëntst. Kan ook nog de test beoordelen en per persoon de hele groep snel bekijken.
  • H5 Op welke vier verschillende manieren kan je scores normeren?
    1. absolute standaard vergelijken: testprestatie wordt beoordeeld zonder die van anderen erbij te betrekken. Heeft weinig betekenis
    2. verhoudingsnormen opstellen. Zoals bijv met het verhoudingsIQ. Scores worden dan gedeeld door een andere variabele en daardoor onafhankelijk gemaakt van die variabele. (IQ = ML / CL x 100%) 
    3. gegevens vergelijken op basis van rangorde. Hiervoor bereken je bijv 99 percentielscores voor 100 gelijke groepen. P30 is het punt waaronder 30% van de scores liggen. Verschil in ruwe score tussen P10 en P20 is een stuk groter dan het verschil tussen P30 en P40. 
    4. gegevens vergelijken op basis van het gemiddelde en e spreiding. Hiervoor gebruik je standaardscores, waarvan de Z-score de bekendste is. Ruwe scores X uitdrukken in het aantal standaarddeviatie-eenheden dat zij van het gemiddelde verwijderd liggen. Lineaire transformaties kun je toepassen om negatieve of kleine getallen aan te passen.
  • H5 wat geeft de z-waarde aan?
    hoeveel standaardafwijkingen de desbetreffende score van het gemiddelde afzit.
  • H5 waar of niet waar?

    Bij een non-lineaire transformatie ( bv kwadrateren) kan de vorm van de (frequentie)verdeling wel veranderen.
    Waar. de frequentieverdeling wordt namelijk normaal, met als gevolg genormaliseerde standaardscores. Hierna moeten de correlaties opnieuw berekend worden.
  • H5 wat zijn staines?
    De breedte van een stanine komt overeen met een halve standaardafwijkingen. Er zijn 9 categorieën of stanines.
  • H5 wat is de deviatie-IQ?
    hierbij worden in plaats van het bepalen van de verhouding van de mentale leeftijd met de chronologische leeftijd, de testprestaties per leeftijdsklasse verwerkt tot genormaliseerde standaardscores met een gem van 100 en spreiding van 15
  • H5 Hoe wordt de mate van overstemming berekend?
    met de Cohens Kappa
  • H5 Welke kanttekeningen zijn er bij een correctiemethode te plaatsen?
    1. scherpe onderscheid tussen wel en niet weten van het goede antwoord discutabel
    2. iemand kan op basis van verkeerd inzicht of informatie een fout antwoord geven
    3. voor toeval gecorrigeerde testscores (Xc), een grotere variantie dan de ongecorrigeerde testscores (X) wat mogelijk ongewenste invloed kan hebben op andere berekeningen. Bijv bij optellen bij deeltoetsen.
    4. De correlatie tussen de gecorrigeerde testscore en de ongecorrigeerde testscore gelijk aan 1. Hierdoor is de ordening van personen identiek, zijn de correlaties aan andere scores identiek en is de nauwkeurigheid en betrouwbaarheid identiek. Als alles identiek is, vervaalt het voordeel van het corrigeren van de testscore.
  • H5 Hoe kan je items betrouwbaarder en meer valide maken?
    - opnemen van meer items
    - beter nadenken over de inhoud van de items
  • H5 wat verstaan we onder adaptief testen
    testen op maat, iedere respondent krijgt een test voorgelegd die op zijn of haar niveau is toegesneden. Grote itembank is belangrijk, omdat er genoeg items moeten zijn op elk niveau en om op het niveau uit te komen waar een ieder op zit.
Read the full summary
This summary. +380.000 other summaries. A unique study tool. A rehearsal system for this summary. Studycoaching with videos.

Latest added flashcards

onderzoek van de relaties tussen verschillende tests die dezelfde begrippen meten heeft betrekking op ...validiteit
soortgenoot
standaardscores hebben altijd een gemiddelde van ... en een standaardafwijking van ...
gemiddelde 0 
sd = 1
een voorbeeld van een score die wordt weergegeven als verhoudingsnorm is
IQ-score
wat zijn antwoordtendenties?
dat je overal hetzelfde invult zonder naar de vraag te kijken
bij predictieve validiteit is de centrale vraag
Hoe goed de test een criterium voorspelt
het afbeelden van een aantal items op een schaal en het toekennen van meetwaarden heet in IRT?
calibreren
Principle Components Analysis wordt vooral gebruikt om...
het aantal onderliggende factoren in kaart te brengen
Als de vragen in een test naast het bedoelde kenmerk ook nog een niet bedoeld kenmerk meten is er sprake van
vraagonzuiverheid
z-scores zijn normaal verdeeld als...
de ruwe scores ook normaal verdeeld zijn
Welke parameter mag niet verschillen bij items in het Birnbaum model?
de giskans