AI-bias i ansættelsesprocessen: den skjulte risiko, som virksomheder overser

Vi ved, at 72 % af HR-lederne mener, at kunstig intelligens kan gentage eller forstærke menneskelige fordomme. Alligevel øger de fleste af dem stadig brugen af kunstig intelligens i rekrutteringsprocessen. Det er ikke nødvendigvis en modsigelse, men det er en misforståelse af, hvordan fordomme i kunstig intelligens rent faktisk fungerer.
Den antagelse, der ligger til grund for de fleste beslutninger om at indføre kunstig intelligens, er, at et værktøj, der er udviklet til at være objektivt, også vil være objektivt. Men gode intentioner vejer ikke tungt, når platformene forstærker allerede eksisterende fordomme og selv udvikler nye. Dette er i praksis detsåkaldte »AI-modenhedsgap«: Udbredelsen af kunstig intelligens sker hurtigere end den nødvendige regulering, der skal sikre en retfærdig anvendelse af disse værktøjer.
Der er tale om AI-bias i ansættelsesprocessen, når data, modeludformning eller den praktiske anvendelse af et AI-værktøj fører til resultater, der systematisk stiller ansøgere dårligere på grund af egenskaber, der ikke har noget med performance at gøre. Det adskiller sig fra menneskelig bias på ét afgørende punkt: Mens menneskelig bias er uensartet og synlig, er algoritmisk bias stabil, skalerbar og ofte usynlig, indtil den allerede har påvirket tusindvis af beslutninger.
Hvorfor kunstig intelligens både kan mindske og øge fordomme i rekrutteringsprocessen
Kunstig intelligens kan fjerne visse former for partiskhed i ansættelsesprocessen. Den anvender de samme kriterier på alle ansøgere, vurderer svarene ved hjælp af den samme algoritme og eliminerer den uensartethed, der opstår, når interviewere er trætte, og vurderingerne træffes på et splitsekund. For organisationer, hvor inkonsekvent menneskelig beslutningstagning har været den primære årsag til urimelige resultater, udgør denne konsistens en forbedring.
Men konsekvens og retfærdighed er ikke det samme. En algoritme, der er trænet på forudindtagede historiske data, vil anvende disse mønstre konsekvent – på alle ansøgere, i alle stillinger og i alle de ansættelsesbeslutninger, organisationen træffer. Den korrigerer ikke for forudindtagetheden i sine træningsdata. Den lærer den at kende og skalerer den derefter.
Vores seneste undersøgelse viser, at HR-ledere mener, at kunstig intelligens både kan forstærke og mindske fordomme. Og de har ret – det afhænger helt af, hvad værktøjet er baseret på, og hvordan det styres. For at få et bredere overblik over både de muligheder og risici, som kunstig intelligens medfører for HR, kan du læseartiklen »Muligheder og faldgruber ved integration af kunstig intelligens i HR«.
Hvordan fordomme smitter af på AI-baserede ansættelsessystemer
Bias opstår ikke pludseligt i AI-systemer. Den opstår på tre specifikke tidspunkter:
- I dataene.AI lærer af historiske oplysninger – tidligere ansættelsesbeslutninger, tidligere performance , tidligere forfremmelsesmønstre. Hvis denne historik afspejler en strukturel skævhed i, hvem der blev ansat, udviklet og fastholdt, lærer modellen disse mønstre at kende som tegn på succes. Et værktøj, der er trænet på ti års ansættelsesdata fra en organisation, der uforholdsmæssigt ofte forfremmede mænd, vil lære, at disse mænds karakteristika er indikatorer for performance. Det er de ikke. De er blot stedfortrædere for de beslutninger, der blev truffet af de personer, der forfremmede dem.
- I modellen.Selv med rene træningsdata kan modeller identificere proxyvariabler – faktorer, der korrelerer med beskyttede karakteristika uden direkte at nævne dem ved navn. Postnumre kan korrelere med etnisk baggrund. Hvilket universitet man har gået på, kan korrelere med socioøkonomisk baggrund. Ordforråd og sætningsopbygning korrelerer ofte med begge dele. En model, der optimeres med henblik på forudsigelsesnøjagtighed, vil udnytte disse signaler, hvis de forbedrer dens resultater, uanset om de er jobrelevante.
- I interaktionen.Spørgsmål og kriterier indeholder forudsætninger om, hvordan en god kandidat ser ud. En rekrutterer, der beder et AI-værktøj om at finde kandidater, der ligner virksomhedens bedste medarbejdere, prioriterer de egenskaber, som disse medarbejdere har til fælles – herunder dem, der ikke har noget med jobbet at gøre. Instruktionen lyder neutral, men resultatet er ofte ikke det. Og fordi fordommen kommer ind gennem prompten snarere end modellen, kan den være usynlig selv for de personer, der betjener værktøjet.
Hvorfor algoritmisk bias er sværere at opdage end menneskelig bias
Menneskelig partiskhed er uforudsigelig. En partisk interviewer har gode og dårlige dage, træffer forskellige beslutninger afhængigt af humøret og skaber et mønster, der er så uoverskueligt, at det kan drages i tvivl eller afvises. Algoritmisk partiskhed er stabil. De samme inddata giver de samme uddata hver gang, uanset hvilken kandidat systemet behandler.
Det er netop denne stabilitet, der gør det farligt. En partisk algoritme afslører sig ikke gennem enkelte dårlige beslutninger – den afslører sig gennem samlede resultater, der først bliver synlige i stor skala. Når mønsteret først viser sig i ansættelsesdataene, har det allerede præget hundredvis eller tusindvis af individuelle beslutninger. Hver for sig virkede de fornuftige, men ingen af dem var tilfældige.
Aktiv overvågning er det eneste pålidelige værn. Derforbruger Assessiodemografiske data til at identificere og korrigere uønskede virkninger i vores assessments. Når alt kommer til alt betyder det at vente på, at et mønster viser sig i resultaterne, at man venter, indtil skaden allerede er sket.
74 % af HR-lederne forventer, at kunstig intelligens vil ændre HR-området. Kun 39 % har retningslinjer for brugen af den.
Konkrete eksempler på AI-bias i ansættelsesprocessen: HireVue og LLM-gennemgang af ansøgninger
I 2020 blev HireVues AI-baserede videointerviewsystem udsat for vedvarende kritik for at analysere kandidaters ansigtsudtryk og kropssprog som indikatorer for jobrelevante egenskaber.
I et dokumenteret tilfælde blev en medarbejder, der var blevet hjemsendt, afvist, da hun genansøgte om sin egen stilling – hun fik gode karakterer for sine svar, men dårlige for sit kropssprog. Værktøjet havde konsekvent truffet disse beslutninger i stor skala, før nogen opdagede det. HireVue fjernede funktionen til ansigtsanalyse i 2021 og erkendte, at den videnskabelige baggrund var mangelfuld.
I en undersøgelse fra 2025, udført af forskere ved Hongkong Universitet og Det Kinesiske Videnskabsakademi, blev fem førende store sprogmodeller testet i forbindelse med gennemgang af ansøgninger. Alle fem udviste systematisk skævhed – de gav kvindelige ansøgere højere karakterer end mandlige ansøgere og gav konsekvent sorte mandlige ansøgere lavere karakterer end hvide mandlige ansøgere med identiske kvalifikationer.
Forskerne konstaterede, at disse skævheder syntes at være dybt forankrede i den måde, modellerne vurderer kandidater på – og at nogle af dem sandsynligvis var opstået eller blevet forstærket i forbindelse med forsøg på at fjerne skævhederne. Værktøjer, der udtrykkeligt var udviklet til at reducere skævheder, havde indkodet nye mønstre i processen.
Hvordan struktureret kunstig intelligens mindsker fordomme i rekrutteringsprocessen
Løsningen på fordomme i forbindelse med kunstig intelligens er ikke at opgive AI helt – det er derimod at indføre AI-processer, der bygger på reel psykometrisk videnskab. Struktureret AI drager ikke forhastede konklusioner om, hvorvidt en ansøger passer til jobbet, men baserer sine beslutninger på validerede data, der er blevet testet for at bekræfte, at de rent faktisk kan forudsige performance.
Tre standarder fastlægger, hvordan det ser ud i praksis:
- Prediktiv validitet– værktøjets resultater afspejler, hvordan kandidaterne rent faktisk klarer sig i stillingen, og ikke blot nogle erstatningsvariable, der tilfældigvis skelner mellem dem med høje og lave resultater.
- Pålidelighed– den samme kandidat vil få et ensartet resultat over tid, hvilket afspejler stabile, jobrelevante egenskaber frem for forbigående omstændigheder.
- Relevans– vurderingen måler kun det, der er afgørende for stillingen, og er blevet testet for eventuel negativ indvirkning på de forskellige demografiske grupper blandt ansøgerne.
Et værktøj, der opfylder alle tre kriterier, kan man stole på til at måle det, det hævder at måle – konsekvent og uden systematisk at stille bestemte grupper af ansøgere dårligere i processen.
Fem måder at undgå partiskhed i forbindelse med AI ved ansættelser
Brug validerede data. Træningsdata bør testes for repræsentativitet med hensyn til køn, alder, etnicitet og andre beskyttede karakteristika, inden de anvendes til at opbygge eller kalibrere en model. Historiske ansættelsesdata er næsten aldrig et sikkert udgangspunkt uden yderligere bearbejdning.
1. Overvåg systematisk skævhed løbende.Test før lancering viser, om et værktøj var retfærdigt, da det blev taget i brug. Det viser dog ikke, om det fortsat er retfærdigt, når kandidatgruppen ændrer sig, stillingen udvikler sig, eller modellen opdateres. Analyse af uønskede konsekvenser bør være en løbende praksis, ikke en engangsforanstaltning.
2. Fjern demografiske data fra inddataene. Alledata, som modellen ikke har brug for til at forudsige performance en risiko for skævheder. Navne, postnumre, uddannelsesinstitutioner og fotos bør fjernes fra inddataene, medmindre der er en specifik, jobrelevant grund til at medtage dem. Selv i så fald bør resultaterne testes for uønskede forskelle i udfaldet.
3. Inddrag menneskelig kontrol. AIbør fremlægge data og anbefalinger. Det er mennesker, der skal træffe de endelige beslutninger, især på afgørende punkter i ansættelsesprocessen. En organisation, hvor AI kan afvise ansøgere uden nogen form for menneskelig gennemgang, har fjernet den kontrol, der ellers kunne opdage systematiske fejl, inden de får større omfang.
4. Sørg for forklarbarhed.Hvis du ikke kan forklare en ansøger, hvad værktøjet har vurderet, hvorfor netop disse faktorer er blevet valgt, og hvordan resultatet er blevet beregnet, er værktøjet ikke klar til ansvarlig brug. Forklarbarhed er ikke blot et lovkrav i henhold til EU’s AI-lov, men en standard, der tvinger leverandører til at begrunde deres metode i stedet for at gemme sig bag proprietære algoritmer.
For værktøjer, der bygger på valideret psykometrisk forskning, er dette ikke nye krav – det er udgangspunktet. Spørgsmålet er ikke, om jeres AI-rekrutteringsværktøjer kan leve op til denne standard. Spørgsmålet er, om de har den nødvendige struktur og styring til at sikre, at de fortsat lever op til disse standarder på ubestemt tid.
👉Denneartikel bygger på forskning fra *The Maturity Gap*, Assessios datadrevne guide til implementering af AI, styring og tillid inden for HR. Download den fulde rapport for at få et indgående indblik i resultaterne. Download The Maturity Gap her.



