Vær kritisk med dine valg af træningsdata - og hav etikken med i overvejelserne, lyder rådet fra AI-ekspert Nicolai Borre, CGI Danmark
Brugen af kunstig intelligens buldrer frem overalt. Fra små pilotprojekter til kæmpestore programmer på enterprise-niveau – AI er her, der og allevegne.
Det er fuldt forståeligt, for potentialet er enormt. Men at få succes med AI, altså at få AI til at skabe reel værdi, kræver en velovervejet, balanceret og ikke mindst ansvarlig tilgang til data.
For midt i al AI-hypen er der en tendens til, at noget ret væsentligt bliver overset i forbifarten: Nemlig de data, som bliver brugt til at træne de nye AI-modeller, vi har så store forventninger til.
Kunstig intelligens er – firkantet sagt – ikke født intelligent. "Intelligensen" kommer først, når modellerne er blevet trænet på en masse data.
Eksempel: Et AI-system til mønstergenkendelse kan ikke bare lige bruges fra det sekund, man sætter strøm til serverne. Systemet skal først trænes ved at se på tusinder og atter tusinder af billeder af mønstre, før det lærer hvad der er det rigtige mønster.
Det giver sig selv, at både omfanget af det valgte datasæt sæt og kvaliteten af træningsdata har afgørende indflydelse på, hvordan en AI-model vil performe.
I CGI arbejder vi med AI-projekter af alle størrelser, for vidt forskellige typer kunder og i forskellige it-miljøer. Selv om AI ofte optræder i sammenhæng med cloud, både private og public cloud, leverer vi også AI-løsninger, som kører på kundens egne servere (on-premise.)
Uanset projektets omfang og fokus, er her nogle gode, universelle råd, vi giver til alle:
- Træn din AI-model meget grundigt, inden den "går live"
- Test flere forskellige brugsscenarier igennem
- Vær kritisk med dine valg af datasæt til træning af modellen
Hvis man ikke gør sit forarbejde grundigt, er risikoen stor for at AI ikke giver den forretningsværdi, man drømte om. Som man siger med et godt, gammeldags brancheudtryk: Garbage in – garbage out.
Hvad med data?
Hvad angår valget af træningsdata, er det vigtigt at få et klart billede af deres oprindelse og sammensætning:
Hvor kommer data fra? Hvem har rettighederne til dem? Er der en overvægt af fx billeder af en bestemt type ansigt, som kan føre til en skævhed i AI-modellens evne til at genkende og kategorisere – altså forudindtagethed, også kaldet bias?
Her taler vi altså om "blødere" begreber som etik og ansvarlig brug, og det er også overvejelser, vi bliver nødt til at have med i vores AI-projekter.
Det er nemlig én ting at have styr på alt det tekniske, som har med datahåndtering at gøre. En helt anden ting er de etiske aspekter.
Etikken fylder mere
Når jeg taler med CGI's kunder om AI, er det tydeligt, at etikken er noget, som fylder mere og mere i virksomheder og organisationer.Tendensen var også tydelig på konferencen AI in Financial Services Conference Nordics, hvor jeg var med i en paneldebat om netop etisk brug af AI i finansielle virksomheder.
At nysgerrigheden og spørgelysten er stor, når det gælder de etiske aspekter ved at bruge kunstig intelligens, er både naturligt og sundt.
Derfor er det også helt naturligt for os i CGI at arbejde med en struktureret tilgang til det, vi betragter som "ansvarlig AI."
Partnerskab om syntestiske data
Et nyttigt værktøj er denne rapport, som jeg på det varmeste vil anbefale at man læser, inden man drager ud på sin AI-rejse:
Desuden er CGI gået i partnerskab med Karlstad Universitetet om et forsknings-og udviklingsprojekt om syntetiske data til træning af AI.
I øvrigt var CGI blandt de første, store it-virksomheder, som frivilligt forpligtede sig til at gøre mere for ansvarlig og etisk AI end hvad Europakommissionen kræver i forordningen 'EU artificial intelligence (AI) Act'.
Læs mere her
Hvordan kommer din virksomhed godt i gang med AI, så I opnår den forventede forretningsværdi? Hvad gør I for at sikre, at det sker ansvarligt og med etikken i orden?
Jeg er altid parat til en uforpligtende dialog. Både om teknikken og etikken…