AI-skjevhet i ansettelser: den skjulte risikoen selskaper overser 

To unge kvinner samarbeider og deler ideer ved hjelp av en bærbar PC og smarttelefon, som representerer samarbeid og digital kommunikasjon i et profesjonelt miljø.

Vi vet at 72 % av HR-ledere tror at AI kan reprodusere eller forsterke menneskelig skjevhet. Likevel øker de fleste av dem fortsatt bruken av AI i ansettelser. Det er ikke nødvendigvis en selvmotsigelse, men det er en misforståelse av hvordan AI-skjevhet faktisk fungerer.

Antagelsen bak de fleste beslutninger om bruk av kunstig intelligens er at et verktøy som er utformet for å være objektivt, vil være objektivt. Men gode intensjoner teller ikke så mye når plattformer skalerer eksisterende skjevheter og utvikler sine egne skjevheter. Dette er modenhetsgapet i kunstig intelligens i praksis. Bruken overgår den styringen som er nødvendig for å bruke disse verktøyene rettferdig.

AI-skjevhet i ansettelser oppstår når data, modelldesign eller operasjonell bruk av et AI-verktøy produserer resultater som systematisk sett setter kandidater i ulempe basert på egenskaper som ikke er relatert til jobbprestasjon. Det er forskjellig fra menneskelig skjevhet på én kritisk måte: der menneskelig skjevhet er inkonsekvent og synlig, er algoritmisk skjevhet stabil, skalerbar og ofte usynlig inntil den allerede har formet tusenvis av beslutninger. 

Hvorfor AI kan både redusere og øke skjevhet i rekruttering 

AI kan fjerne visse typer skjevheter fra ansettelser. Den bruker de samme kriteriene på alle kandidater, scorer svarene ved hjelp av samme algoritme og eliminerer variasjonen som følger med slitne intervjuere og vurderinger på et splittsekund. For organisasjoner der inkonsekvent menneskelig beslutningstaking har vært den primære årsaken til urettferdige resultater, er denne konsistensen en forbedring. 

Men konsistens og rettferdighet er ikke det samme. En algoritme som er trent på partiske historiske data, vil anvende disse mønstrene konsekvent – ​​på hver kandidat, i hver rolle, på tvers av hver ansettelsesbeslutning organisasjonen tar. Den korrigerer ikke for skjevheten i treningsdataene sine. Den lærer den, og deretter skalerer den den. 

Vår nylige undersøkelse viste at HR-ledere mener at AI både kan forsterke og redusere skjevheter. Og de har rett – det avhenger helt av hva verktøyet ble bygget på og hvordan det styres. For en bredere oversikt over både mulighetene og risikoene AI medfører for HR, se Løftet og fallgruvene ved AI-integrasjon i HR

Hvordan skjevheter kommer inn i AI-ansettelsessystemer 

Skjevhet opptrer ikke i fullt utviklete AI-systemer. Den oppstår på tre spesifikke tidspunkter: 

  • I dataene. AI lærer av historisk informasjon – tidligere ansettelsesbeslutninger, tidligere prestasjonsvurderinger, tidligere forfremmelsesmønstre. Hvis denne historikken gjenspeiler strukturell skjevhet i hvem som ble ansatt, utviklet og beholdt, lærer modellen disse mønstrene som signaler på suksess. Et verktøy trent på ti år med ansettelsesdata fra en organisasjon som forfremmet menn uforholdsmessig mye, vil lære at egenskapene til disse mennene er prediktorer for ytelse. Det er de ikke. De er stedfortredere for beslutningene til personene som forfremmet dem.
  • I modellen. Selv med rene treningsdata kan modeller identifisere proxyvariabler – faktorer som korrelerer med beskyttede egenskaper uten å navngi dem direkte. Postnumre kan korrelere med etnisitet. Universitetsutdanning kan korrelere med sosioøkonomisk bakgrunn. Vokabular og setningsstruktur korrelerer ofte med begge deler. En modell som optimaliserer for prediktiv nøyaktighet, vil bruke disse signalene hvis de forbedrer resultatene, uavhengig av om de er jobbrelevante. 
  • I samhandlingen. Instruksjoner og kriterier legger grunnlaget for antagelser om hva som er bra. En rekrutterer som ber et AI-verktøy om å finne kandidater som ligner på selskapets toppkandidater, prioriterer de egenskapene disse kandidatene deler – inkludert de som ikke har noe med jobben å gjøre. Instruksjonen høres nøytral ut, men resultatet er det ofte ikke. Og fordi skjevheten kommer inn gjennom instruksjonen snarere enn modellen, kan den være usynlig selv for de som bruker verktøyet. 

Hvorfor algoritmisk skjevhet er vanskeligere å oppdage enn menneskelig skjevhet

Menneskelig skjevhet er inkonsekvent. En partisk intervjuer har gode dager og dårlige dager, ringer forskjellige anrop i forskjellige humør, og produserer et mønster som er rotete nok til å bli utfordret eller avvist. Algoritmisk skjevhet er stabil. De samme inputene vil produsere de samme outputene, hver gang, på tvers av hver kandidat systemet behandler. 

Det er denne stabiliteten som gjør den farlig. En partisk algoritme viser seg ikke gjennom sporadiske dårlige beslutninger – den viser seg gjennom samlede utfall som bare blir synlige i stor skala. Når mønsteret viser seg i ansettelsesdata, har det allerede formet hundrevis eller tusenvis av individuelle beslutninger. Hver av dem så rimelig ut isolert sett, men ingen av dem var tilfeldige. 

Aktiv overvåking er det eneste pålitelige forsvaret. Derfor bruker Assessio demografiske data for å identifisere og korrigere negative konsekvenser på tvers av vurderingene våre . Å vente på at et mønster skal bli synlig i resultatene betyr tross alt å vente til skaden allerede er skjedd. 

74 % av HR-ledere forventer at AI vil transformere HR. Bare 39 % har retningslinjer for å styre det.

Ekte eksempler på AI-skjevhet i ansettelser: HireVue og LLM CV-screening

I 2020 ble HireVues AI-drevne videointervjusystem gjentatt kritisert for å ha analysert kandidatenes ansiktsuttrykk og kroppsspråk som representasjoner av jobbrelevante trekk.  

I ett dokumentert tilfelle ble en permittert ansatt avvist da hun søkte på nytt på jobb – og fikk gode resultater på svarene sine, men dårlige på kroppsspråket. Verktøyet hadde konsekvent tatt disse avgjørelsene i stor skala, før noen la merke til det. HireVue fjernet ansiktsanalysefunksjonen i 2021, og erkjente at vitenskapen var feilaktig. 

En studie fra 2025 utført av forskere ved University of Hong Kong og Chinese Academy of Sciences testet fem ledende store språkmodeller for CV-screening. Alle fem viste systematisk skjevhet – kvinnelige kandidater fikk høyere poengsum enn mannlige kandidater, og svarte mannlige kandidater fikk konsekvent lavere poengsum enn hvite mannlige kandidater med identiske kvalifikasjoner.  

Forskerne bemerket at disse skjevhetene virket dypt forankret i hvordan modellene evaluerer kandidater – og at noen sannsynligvis hadde blitt introdusert eller forsterket under forsøk på å redusere skjevheter. Verktøy som eksplisitt var utformet for å redusere skjevheter, hadde kodet inn nye mønstre i prosessen. 

Hvordan strukturert AI reduserer skjevhet i rekruttering 

Løsningen på AI-skjevhet er ikke å forlate AI helt – det er å implementere AI-prosesser bygget på reell psykometrisk vitenskap. Strukturert AI gjør ikke antagelser om jobbtilpasning, men baserer sine beslutninger på validerte data som er testet for å bekrefte at den faktisk forutsier ytelse. 

Tre standarder definerer hvordan det ser ut i praksis: 

  • Prediktiv validitet – verktøyets resultater korrelerer med hvordan kandidatene faktisk presterer i rollen, ikke med proxy-variabler som tilfeldigvis skiller de som skårer høyt fra de som skårer lavt. 
  • Pålitelighet – den samme kandidaten ville fått et konsistent resultat over tid, som gjenspeiler stabile jobbrelevante egenskaper snarere enn forbigående omstendigheter. 
  • Relevans – vurderingen måler kun det som er viktig for stillingen, testet for negativ innvirkning på tvers av de demografiske gruppene i kandidatpopulasjonen. 

Et verktøy som oppfyller alle tre kravene, kan stoles på at det måler det det hevder å måle – konsekvent og uten systematisk å sette grupper av kandidater i ulempe i prosessen. 

Fem måter å forhindre AI-skjevhet i ansettelser 

Bruk validerte data. Opplæringsdata bør testes for representativitet på tvers av kjønn, alder, etnisitet og andre beskyttede egenskaper før de brukes til å bygge eller kalibrere en modell. Historiske ansettelsesdata er nesten aldri et trygt utgangspunkt uten inngripen. 

1. Overvåk skjevheter kontinuerlig. Testing før lansering forteller deg om et verktøy var rettferdig da det ble tatt i bruk. Det forteller deg ikke om det forblir rettferdig når kandidatpoolen endres, rollen utvikler seg eller modellen oppdateres. Analyse av negative konsekvenser bør være en kontinuerlig praksis, ikke en engangsgodkjenning. 

2. Fjern demografiske inndata. Alle data modellen ikke trenger for å forutsi jobbytelse, er data som skaper risiko for skjevhet. Navn, postnumre, utdanningsinstitusjoner og bilder bør fjernes fra inndata med mindre det er en spesifikk, jobbrelevant grunn til at de er inkludert. Selv da bør resultatene testes for ulik innvirkning. 

3. Legg til menneskelig tilsyn. AI bør avdekke data og anbefalinger. Mennesker bør ta de endelige avgjørelsene, spesielt på viktige punkter i ansettelsesprosessen. En organisasjon der AI kan avvise kandidater uten menneskelig gjennomgang har fjernet kontrollen som kan fange opp systematiske feil før den skalerer. 

4. Sørg for forklarbarhet. Hvis du ikke kan forklare en kandidat hva verktøyet vurderte, hvorfor disse faktorene ble valgt og hvordan resultatet ble nådd, er ikke verktøyet klart for ansvarlig bruk. Forklarbarhet er ikke bare et regulatorisk krav i henhold til EUs AI-lov, det er standarden som tvinger leverandører til å rettferdiggjøre metodikken sin i stedet for å gjemme seg bak proprietære algoritmer. 

For verktøy bygget på validert psykometrisk vitenskap er ikke dette nye krav – de er utgangspunktet. Spørsmålet er ikke om AI-ansettelsesverktøyene dine kan oppfylle denne standarden. Det er om de har strukturen og styringen til å sikre at de fortsetter å oppfylle disse standardene på ubestemt tid. 

👉 Denne artikkelen bygger på forskning fra The Maturity Gap, Assessios datadrevne guide til AI-adopsjon, styring og tillit i HR. Last ned hele rapporten for å utforske funnene i dybden. Last ned The Maturity Gap her.