Evaluatie

Om de leeropbrengst van de lessenserie te achterhalen zijn er vier evaluatie-instrumenten ontwikkeld. Natuurlijk zijn er per les meerdere leerdoelen voor de leerlingen opgesteld, maar vier doelen zijn nader bekeken. Twee instrumenten die wij ontwikkeld hebben evalueren een cognitief leerdoel, twee een leerdoel op het gebied van onderzoeksvaardigheden.


Het eerste instrument meet het volgende leerdoel: De leerlingen kunnen aan het einde van de lessenserie het verschil beschrijven tussen een collectief en een individueel graf en van beide graven één voorbeeld noemen. Dit doel is met behulp van stellingen geëvalueerd. Om de leeropbrengst te achterhalen is er een voor- en nameting gedaan. De leerlingen kregen, aan het begin van les één en aan het einde van les drie, tien stellingen te zien en moesten hierbij vervolgens, door middel van een rood en een groen blaadje, aangeven welk antwoord goed was. De stellingen hadden betrekking op de verschillende aspecten die in de lessenserie aan bod zouden komen. Na meting één hadden wij een duidelijk beeld van de beginsituatie van de leerlingen. Omdat wij bij meting één al zagen dat veel stellingen erg goed beantwoord waren, hebben wij hier in het vervolg rekening mee gehouden. Een dergelijke meting geeft de leerkracht te mogelijkheid de lessen voort te zetten op het niveau van de leerlingen. Wel zijn er een aantal nadelen aan het ontwikkelde instrument. Zo is er sprake van een hoge gokkans (dit blijft in alle gevallen wanneer er een keuze is tussen twee antwoorden) en kunnen de leerlingen elkaars antwoorden overnemen (oplossing: leerlingen met hun ogen dicht laten kiezen). Wij waren van plan om de leerlingen hun antwoorden te laten beargumenteren, maar dat bleek in de praktijk niet te werken. Er is namelijk te weinig tijd om alle leerlingen aan het woord te laten en om alle keuzes te laten beargumenteren. Daarom hebben wij een schriftelijke toets gemaakt. Hierop kunnen de leerlingen het goede antwoord aankruisen én kunnen ze hun antwoorden beargumenteren. Hierbij is het wel belangrijk dat de leerlingen een aanzienlijk niveau qua begrijpend lezen en een uitgebreide woordenschat hebben.

Het tweede instrument dat wij ontwikkeld hebben richt zich op het doel: aan het einde van de lessenserie zijn de leerlingen in staat om minimaal 10, 15 of 20 (afhankelijk van het niveau) van de 25 door hen gekozen (nieuwe) woorden te herkennen en te koppelen aan de juiste definitie. Dit doel is opgesteld aan de hand van literatuur, waaruit bleek dat leerlingen per keer vijf woorden onthouden (Morrison, Ross, Kalman & Kemp, 2011). Om hier conclusies over te kunnen trekken, kregen de leerlingen een schriftelijke toets. Hierbij werd hen, via een werkblad, gevraagd om 25 woorden aan de juiste definitie koppelen. Deze 25 woorden hebben gedurende de lessenserie op de woordenmuur gehangen en zijn tijdens de lessen geregeld behandeld en teruggevraagd. Wij hebben differentiatie toegepast op drie verschillende niveaus. Deze niveaus hebben wij vastgesteld aan de hand van resultaten op het gebied van begrijpend lezen en woordenschat, de twee domeinen die van toepassing zijn tijdens het uitvoeren van de opdracht. Opvallend was dat alle leerlingen, op één na, het leerdoel behaald hebben. Daarnaast was er ontzettend veel verschil tussen de leerlingen binnen één groep. Zo waren er leerlingen uit de groep die 10 woorden goed moest hebben, die beter scoorden dan de groep waar men er 20 juist moest koppelen. Wij kunnen daarom concluderen dat wij het bovenstaande doel te laag hebben gesteld.

Een derde instrument meet het doel: leerlingen verwoorden en onderbouwen hun uit het schaalmodel verkregen keuzes voor de manier van bouwen aan de hand van zelfgevormde, relevante of door leerkracht gestuurde argumenten. De leerlingen hebben in les twee een reconstructie gemaakt van de bouw van een hunebed (zie het blog over les twee). Dit doel richt zich op de argumentatie daarvan. Omdat het gezien de beschikbare tijd niet mogelijk was om alle leerlingen te observeren en te scoren hebben wij drie leerlingen gekozen die wij nader zijn gaan volgen. Zo hebben wij één sterke, een gemiddelde en één zwakke leerling gevolgd op de gebieden begrijpend lezen en woordenschat. De resultaten van deze leerlingen hebben wij gegeneraliseerd naar de rest van de klas. De rol van de leerkracht tijdens de argumentatie is erg belangrijk. De leerkracht moet de leerling namelijk sturen aan de hand van van tevoren opgestelde vragen. De leerkracht moet zo min mogelijk ingaan op wat de leerling vertelt. Dit om te voorkomen dat de leerkracht eigen woorden in de mond van de leerling legt. Een vereiste voor dit instrument is dat de argumentatie van de leerlingen vastgelegd wordt op film. Hierdoor kan de leerkracht de argumentatie in een later stadium scoren. Het is immers niet mogelijk om dit tegelijkertijd te doen.

Het laatste instrument meet het volgende doel: Leerlingen gebruiken kennis en (eigen) ervaring om te voorspellen hoe een piramide gemaakt is in historisch perspectief. Dit hebben wij gemeten door de leerlingen een tekening te laten maken waarop naar voren moest komen hoe een piramide is gebouwd. Deze tekening mocht worden vergezeld door tekst. Het is bij deze opdracht belangrijk dat er benadrukt wordt dat het om de piramide gaat en niet om het hunebed. Veel leerlingen begonnen namelijk met het tekenen van een hunebed. Daarnaast is het belangrijk dat de tekeningen anoniem ingeleverd worden. De tekeningen hebben wij vervolgens geanalyseerd aan de hand van het ontwikkelde instrument. Dit hebben wij afzonderlijk van elkaar gedaan zodat het instrument aangepast kon worden naar aanleiding van de verschillende scores en interpretaties (intercodeurs betrouwbaarheid). Om eigen interpretatie te voorkomen zou er een vraaggesprek met de leerlingen moeten volgen. Hierin kan de leerling zijn of haar tekening zelf toelichten.

Omdat bovenstaande instrumenten niet meerdere malen getest zijn, is niet met zekerheid te zeggen dat ze betrouwbaar en valide zijn. Betrouwbaarheid houdt in dat verschillende observatoren hetzelfde instrument op dezelfde wijze beoordelen. Wij hebben de instrumenten afzonderlijk van elkaar getest, zodat wij de verschillen en misinterpretaties eruit hebben kunnen halen. Valide wil zeggen dat het instrument meet wat het beoogt te meten (Hoyle, Harris & Judd, 2002). Wij hebben de instrumenten hier en daar aangepast om de validiteit zo hoog mogelijk te maken. Maar om de instrumenten volledig betrouwbaar en valide te maken, is verder onderzoek nodig door de instrumenten door meerdere observatoren te laten gebruiken, de resultaten te vergelijken en de instrumenten zo nodig aan te passen.

Groetjes, Annelot en Nadie

Hoyle, R.H., Harris, M.J. & Judd, C.M., (2002). Research: Methods in Social Relations. Londen: Holt, Rinehart & Winston.

Morrison, G.R., Ross, S.M., Kalman, H.K., Kemp, J.E. (2011). Designing effective instruction. Denvers: John Wiley & Sons

Volgende bericht
Een reactie plaatsen

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: