Av Bjørn Bolstad
De fleste eksamener i skolen er avlyst denne våren, og statsråd Tonje Brenna har oppfordret alle skoler til å prøve ut alternative former for sluttvurdering. Sluttvurderingen i norsk skole består av avsluttende eksamen, fagprøver og standpunktkarakterer.
I Norge utgjør standpunktkarakterene vanligvis 80% av elevenes samlede karakterer på vitnemålet. Når eksamen er avlyst, vil standpunktkarakterene utgjøre en større del av vitnemålet. Det er derfor viktig at skoler har en god praksis for fastsettelse av standpunktkarakterer.
Med avlyst eksamen bør også backwash-effekten ved eksamen bli mindre enn tidligere år. Skoler kan få mer tid og rom enn tidligere til å arbeide med læringsaktiviteter og til å prøve ut ulike vurderingsformer.
Formålet med denne teksten er å øke skolelederes forståelse for et fagfelt – vurdering – der ledere ikke selv er de som utøver faget. Jeg ønsker å peke på potensielle motsetninger knyttet til standpunktvurdering som lærere og skoleledere bør være oppmerksomme på. Teksten peker også på implikasjoner og gir mulige råd om hvordan skoleledere kan lede skolers arbeid med vurdering og standpunktfastsettelse.
Her kan du høre et intervju med Bjørn Bolstad i Skolelederforbundets podkast Viktigste leder. Artikkelen fortsetter under podkasten.
Balansen mellom policy, forskning og praksis
Vurdering av elever er i Norge regulert av Forskrift til opplæringsloven §3, heretter kalt forskriften. Men det finnes flere styringsdokumenter som omhandler vurdering: Læreplanverket, både overordnet del og de ulike fagplanene, har avsnitt om vurdering, og dette er styringsdokumenter med forskriftstatus. Utdanningsdirektoratet publiserer også støttemateriell, noe av dette i form av regelfortolkninger og anbefalinger. Her kan lærere og ledere finne god informasjon.
Både lover, forskrifter og direktoratets tolkninger og råd er en del av det som kalles policy, politiske signaler med ulik hjemmel og styrke. Policydokumenter er i varierende grad basert på forskning eller praksis og kan uttrykke ideologiske ønsker og synspunkter. Det varierer i hvilken grad policydokumenter åpner for at det er en spenning mellom ulike mål og intensjoner.
Det er gjort mye forskning på elevvurdering, både i Norge og internasjonalt. Noe av denne forskningen kan belyse spørsmål om vurdering på andre måter enn policydokumenter. Det kan også finnes momenter som forskning har pekt på, men som ikke trekkes inn i policydokumenter.
Men vurderingspraksis gjennomføres nettopp i praksis. Praksisen som utvikles på enkeltskoler må være basert på policy-dokumenter, men bør også være opplyst av forskning. Samtidig må enhver praksis tilpasses den konteksten der den foregår. Nasjonale policy-dokumenter og utdanningsforskning må derfor tilpasses den enkelte skole.
Vurdering er tolkning
Vurdering av elever er en tolkning av elevenes kompetanse. Det er viktig at både lærere og skoleledere erkjenner at vurdering er tolkning. Fjørtoft og Sandvik (2016) hevder at all vurderingspraksis bygger på tre grunnleggende prinsipper:
- Lærere må ha en teoretisk forståelse (en modell) om hvordan elever utvikler sin kompetanse og hvordan læring kommer til syne innenfor et fagområde.
- Elevene må gjøre oppgaver og delta i aktiviteter der lærere kan observere elevenes prestasjoner.
- Lærere som observerer elevenes læring, må kunne fortolke observasjonene og trekke slutninger om elevenes læringsprosess og læringsutbytte.
Siden vurdering er fortolkning, er det viktig at ansatte på skoler utvikler tolkningsfellesskap. Slike tolkningsfellesskap kan også etableres på tvers av skoler.
Sentrale begreper knyttet til vurdering
Både vurderingsforskere og policy-dokumenter løfter frem sentrale forhold og begreper ved vurdering. Begrepene som brukes i skolen kan ha ulikt opphav, og jeg vil nedenfor belyse noen slike begreper.
Forholdet mellom underveisvurdering og sluttvurdering: vurderingens ulike formål
Utdanningsforskere peker på at vurdering av elever har ulike formål (Black & Wiliam, 1999; Fjørtoft & Sandvik, 2016; Gusky, 2014). Formativ vurdering har blant annet som formål å bidra til at elevene lærer mer og utvikler sin kompetanse. Summativ vurdering har som formål å avdekke hva elevene har lært. Forskriften bruker begrepene underveisvurdering og sluttvurdering. Underveisvurderingen kan ha både formative og summative formål (Fjørtoft og Sandvik, 2016).
Forskriftens §3-3 peker på tre formål ved elevvurdering: fremme læring, bidra til lærelyst og gi informasjon om kompetanse. Forskriften sier ikke noe om at disse formålene kan komme i konflikt med hverandre. Informasjon om kompetanse kan både skape lærelyst og forstyrre lærelyst. Og vurdering som fremmer læring gir ikke automatisk gyldig informasjon om elevens kompetanse.
Den enkelte skole og lærer må balansere ulike formål med vurderingen.
Samlet kompetanse og teksten «om faget»
Forskriften påpeker at det er elevenes samlede kompetanse som skal danne grunnlag for standpunktkarakterene. Skoler i fellesskap og enkeltlærere må derfor spørre seg: hva betyr samlet kompetanse i de ulike skolefagene?
Erfaring har vist at norske lærere først leser kompetansemål for fagene når de skal gjøre seg kjent med en ny læreplan. Det kan være på sin plass å minne om at kompetansemålene er målformuleringer, altså beskrivelser av hva samfunnet ønsker at elevene skal ha lært når de er ferdig med et hovedtrinn. Dette ble også presisert på Udirs webinar om standpunktvurdering den 22. mars i år. Kompetansemålene er ikke undervisningsopplegg eller beskrivelse av formålet med faget. Ledere bør derfor sikre at lærere leser og forstår hele læreplanverket i sammenheng.
Andreassen (2021) hevder at det er mer krevende å vurdere kompetanse enn å vurdere om elever kjenner et avgrenset kunnskapsinnhold. En grunn til dette er at elever kan vise sin kompetanse på svært ulike måter og gjennom ulikt faglig innhold. Både kunnskaper og ferdigheter er nødvendige for at man skal ha kompetanse. Men siden kompetanse er å bruke kunnskaper og ferdigheter, må elevene vurderes i situasjoner der de bruker kunnskaper og ferdigheter, og ikke bare gjengir eller beskriver dem. Det er trolig en utfordring for skoler å utvikle og legge til rette for både kjente og ukjente situasjoner der elevene kan anvende kunnskaper og ferdigheter, slik det er formulert i gjeldende kompetansedefinisjon.
Elevene skal vise kompetanse på ulike måter
Forskriftens §3-15 sier at elevene skal få høve til å vise kompetansen sin på fleire og varierte måtar. Siden vurdering kommer til uttrykk nettopp i læreres og elevers praksis, må ansatte på hver skole sammen tolke hvordan de kan oppfylle dette kravet. Dette er noe av det et tolkningsfellesskap skal bidra til. Profesjonsfellesskapene må altså være tolkningsfellesskap, og skoleledere må bidra til å utvikle dette.
Noen lærere bruker begrepet «vurderingssituasjoner» og mener med det planlagte og tydelig innrammede situasjoner der elevene skal vise hva de har lært. Dette kan være skriftlige eller muntlige prøver, fremføringer, fagsamtaler, at elevene skal lage noe, eller at de skal løse mer eller mindre komplekse problemer. Noen prøver er rene kunnskapsprøver mens andre prøver kan være avgrensede ferdighetsprøver.
Forskriften sier ingenting om slike avgrensede prøver, hverken at de må gjennomføres eller at de ikke skal gjennomføres. Utdanningsdirektoratet påpeker at standpunktkarakterer skal vise hvilken kompetanse elevene har vist. Mange skoler prøver ut ulike og nye vurderingssituasjoner, og dette er et arbeid som trolig vil pågå i mange år.
Mange lærere og skoleledere spør seg hvor mange muligheter elevene skal få til å vise sin kompetanse. På noen skoler er det etablert regler eller planer for hvor mange vurderingssituasjoner elevene skal ha hvert semester. Forskriften sier ikke noe om dette. Antallet «vurderingssituasjoner» er altså ikke avgjørende. Det er derimot avgjørende at elever får mulighet til å vise kompetanse på ulike måter. Hvor mange prøver, fremføringer, samtaler og annet elevene skal ha i løpet av et skoleår er trolig viktig for at lærere skal oppleve at den standpunktkarakteren de gir, er rimelig. Skoleledere må trygge lærere i dette.
Skar og Hopfenbeck (2021) har utarbeidet en kunnskapsoppsummering om standpunktfastsettelse. Her påpeker de at lærere opplever motstridende «bevis» for elevers læring. En elev kan ha vist god kompetanse i oktober, men ikke vise samme kompetanse i april. Tolkningsfellesskapene på skolen må drøfte problemstillinger som dette.
Lærere og skoleledere spør seg også om den kompetansen elevene viser i timene, kan trekkes inn i standpunktfastsettelsen. Forskriften sier ikke at standpunktkarakterene bare skal bygge på det elevene har vist i avgrensede og avtalte «vurderingssituasjoner». Den sier tvert imot at den kompetansen eleven har vist underveis, skal trekkes inn i standpunktvurderingen. Lærere kan basere standpunktkarakterer på alle observasjoner de kan trekke slutninger om elevenes kompetanse ut fra.
Skoleledere må sikre at skolen utvikler systemer for dokumentasjon av kompetanse som elevene viser løpende i opplæringen. Godt arbeid i profesjonsfellesskapene kan minke den utryggheten lærere kan oppleve når de ikke lenger skal sette standpunkt utelukkende på grunnlag av noen få prøver eller andre «vurderingsuttrykk».
Er både gyldighet, pålitelighet og rettferdighet mulig?
Flere forskere påpeker at vurdering av elever må være både pålitelig, gyldig og rettferdig (Fjørtoft & Sandvik, 2016; Skar og Hopfenbeck, 2021; Utdanningsdirektoratet, 2020).
Pålitelighet, i forskning omtalt som reliabilitet, handler om hvorvidt vi kan stole på de fortolkningene og slutningene lærere gjør om elevenes læringsutbytte og kompetanse. Man kan forstå begrepet ved å spørre seg hvor sannsynlig det er at ulike lærere ville gitt samme vurdering på det en elev produserer eller gjør. Erfaring fra skriftlig eksamen i norsk viser at dette ikke alltid er tilfelle.
Den enkelte lærerens dømmekraft er ikke nok for å sikre reliabilitet (Fjørtoft og Sandvik, 2016). For å sikre pålitelighet trenger man en form for standardisering eller formalisering av prosedyrer. Dette kan være stramt definerte oppgaver som flervalgsprøver og felles vurderingskriterier og at profesjonsfellesskapene bygger felles forventning til elevenes læring.
Gyldighet, eller validitet, handler om hvorvidt en utfordring, oppgave, problemstilling, prøve eller annet faktisk viser den kompetansen lærere ønsker at den skal vise. Hvis et mål for opplæringen er at eleven skal utforske dagsaktuelle tema, må lærerne velge aktiviteter som gjør det mulig for eleven å vise utforsk av nettopp aktuelle spørsmål.
Det er en motsetning mellom pålitelighet og gyldighet. Dette berøres ikke i policy-dokumentene. En flervalgsprøve kan ha høy pålitelighet, men hvis eleven skal vise komplekse kompetanser, vil den ikke være særlig gyldig. Skoler og lærere må derfor balansere hensynet til både pålitelighet og gyldighet
Ledelse av tolkningsfellesskaper
Ledere må sørge for at skoler utvikler tolkningsfellesskaper om vurdering. Dette betyr selvsagt ikke at skoleledere selv må lede et slikt arbeid eller at skoleledere må være de som er de beste vurdererne på skolen.
Ledelsesforskerne Alvesson, Blom og Sveningsson (2016) presenterer seks ulike moduser eller organiseringsformer som samlet kan beskrive ulike lederpraksiser. Disse seks organiseringsmodusene er overlappende og påvirker hverandre. Ledere kan utvikle tolkningsfellesskap om vurdering gjennom flere av disse lederpraksisene, her med engelsk originalbegrep i parentes:
- Lederskap (leadership): Å peke på mål og hensikt; gi mening og følelsesmessig og moralsk støtte; eksemplarisk atferd.
- Organisering (management): Lage planer, budsjetter, regler og instrukser; instruere og kontrollere.
- Maktbruk (excercise of power): Vise autoritet, pålegge, true med eller love sanksjoner eller belønning, mobilisere gruppepress.
- Nettverk (peer influencing): Arbeid med faglige spørsmål i nettverk, konferanser; bruke kontakter.
- Gruppearbeid (group work): Felles beslutning, teammøter og gjensidig tilpasning på daglig basis.
- Autonomi (autonomy): Bestemme selv, sette egne mål og standarder, evaluere eget arbeid.
Tolkningsfellesskap kan åpenbart ikke utvikles med gjennomført autonom organisering. Ledere må bringe ansatte sammen for at det skal utvikles et tolkningsfellesskap.
Ledere bør utøve lederskap og bruke tid og energi på å skape forståelse for og tilslutning til fellesskap om vurdering på en skole. Trolig vil ingen endre vurderingspraksis dersom de ikke ser et behov for endring. Ledere kan bruke argumenter som at standpunktkarakterene skal være pålitelige og gyldige, eller at vurderingen skal være en integrert del av opplæringen som argumenter for å skape tilslutning til arbeidet i et tolkningsfellesskap. Ledere kan også hente frem god vurderingspraksis som allerede foregår på skolen.
Organisering er en viktig side ved ledelse, og ledere må organisere arbeidsdagene slik at det er mulig for ansatte på skolen å utvikle felles tolkningspraksis. Det er avgjørende at det settes av tid til dette. Men det er ikke nok at lærere møtes: arbeidet må også planlegges og tilrettelegges, og også dette er et lederansvar: Ansatte på skolen må drøfte hva en ny læreplan og ny vurderingsforskrift betyr for vurdering og standpunktfastsettelse. Lærere bør drøfte hva de oppfatter som samlet kompetanse i faget og hvilke oppgaver og arbeider elevene kan gjøre som lærerne kan fortolke.
Lærere kan diskutere anonymiserte elevbesvarelser opp mot læreplanen, slik Utdanningsdirektoratet foreslår. Men siden elevene skal kunne vise kompetanse på flere og varierte måter, må lærere diskutere flere former for elevarbeider enn skriftlige elevsvar. Hvis lærere bare drøfter skriftlige elevarbeider, risikerer man at dette tolkningsarbeidet ubevisst avgrenser hvordan elevene kan vise sin kompetanse.
Tolkningsfellesskap om standpunktkarakterer skapes ikke bare på det ukentlige personalmøtet, men utvikles i det daglige arbeidet der lærere jobber både alene og sammen med kolleger. Utvikling av vurderingspraksis foregår også ved kaffemaskinen og i korridorene. På mange skoler påvirkes også læreres vurderingspraksis gjennom nettverk og gruppearbeid, både internt i og på tvers av skoler. Mange lærere deltar på webinarer og lignende om vurdering, de har kontakt med lærere på andre skoler eller deltar i faggrupper på sosiale medier. Dette kan gi verdifulle faglige bidrag til skolen.
Skolelederes ansvar er omfattende, og skoleledere påvirker skolens vurderingspraksis på mange måter. Ny læreplan, endring av forskriften og avlyste eksamener gir gode muligheter for å justere den enkelte skoles vurderingspraksis, og skoleledere får mulighet til å lede dette spennende arbeidet.
Kilder
Alvesson, M, Blom, M. & Sveningssen, S (2016) Reflexive Leadership – organising in an imperfect world. Sage Publications
Andreassen, S-E. & Tiller, T. (2021) Rom for magisk læring? Oslo: Universitetsforlaget
Black, P. & Wiliam, D. (2009) Developing the theory of formative assessment. Educational Assessment, Evaluation and Accountability 5/2009, s. 21:5–31
Fjørtoft, H. & Sandvik, L. V. (2016) Vurderingskompetanse i skolen. Oslo: Universitetsforlaget
Gusky, T. (2014). On Your Mark. Challenging the Conventions of Grading and Reporting. Bloomington: Solution Tree
Kunnskapsdepartementet (2016) Fag – Fordypning – Forståelse — En fornyelse av Kunnskapsløftet (Meld St 28 (2015-2016)).
Lovdata (2020): Forskrift til Opplæringslova.
Skar, G. B. & Hopfenbeck, T. N. (2021) Kunnskapsgrunnlag om standpunktvurdering. Utdanningsdirektoratet
Utdanningsdirektoratet (2017): Overordnet del – prinsipper for læring, utvikling og danning.
Utdanningsdirektoratet (2020). Vurderinger og anbefalinger om fremtidens eksamen (Eksamensutvalget). Rapport. Utdanningsdirektoratet
Utdanningsdirektoratet (2022): webinar om standpunktvurdering 22.3.2022 https://vimeo.com/event/1947861/videos/689186559/