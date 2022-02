Når folk skal vurdere om et ansikt er syntetisk fremstilt av kunstig intelligens eller ekte, treffer de omtrent halvparten av gangene. Vi kunne like gjerne gjettet vilt.

Det viser en undersøkelse gjennomført av forskerne Sophie J. Nightingale og Hany Farid.

De kombinerte psykologi og datavitenskap for å finne ut om mennesker klarer å se forskjell på falske ansikter skapt av kunstig intelligens (AI) og ekte ansikter – og hvordan vi forholder oss til de falske ansiktene.

− Vår vurdering er at AI-skapte ansikter ikke bare er skummelt realistiske. Syntesemotoren er i stand til å skape ansikter som ikke kan skilles fra ekte og som fremstår mer pålitelige enn ekte ansikter, skriver forskerne, som jobber ved henholdsvis Lancaster University og University of California.

Generator og diskriminator

Bak eksperimentet står et såkalt Generative Adversarial Network (GAN). Teknologien er populær for å syntetisere innhold som bilder, video eller lyd.

En GAN setter to ulike nevrale nettverk opp mot hverandre, én generator og én diskriminator. Generatoren trenes i å produsere bilder, diskriminatoren trenes i å skille falske og ekte bilder fra hverandre.

Generatoren starter med en tilfeldig rekke piksler, og gjennom flere iterasjoner (gjentakelser) lærer den å syntetisere et falskt, men realistisk ansikt. For hver iterasjon tar diskriminatoren imot bildene, sammen med ekte bilder, og skiller de falske bildene den blir presentert for av generatoren. Diskriminatoren «straffer» generatoren for bilder som er falske, og generatoren lærer seg å syntetisere stadig mer realistiske ansikter.

Slik fortsetter det helt til diskriminatoren ikke klarer å skille mellom falskt og ekte lenger.

Selv om det er gjort fremskritt i utviklingen av automatiske teknikker for å oppdage AI-generert innhold, gjerne kalt deepfake, er ikke de teknikken vi har i dag verken effektive eller nøyaktige nok til å håndtere strømmen av daglige opplastinger av slikt innhold, mener forskerne.

− Brukerne av nettløsninger må selv skille det ekte fra det falske. Derfor har vi utført en serie observasjonsstudier for å finne ut om deltagerne kan skille toppmoderne GAN-syntetiserte ansikter fra ekte ansikter og hvilket nivå av tillit ansiktene fremkalte, skriver de i artikkelen.

Gjettet riktig halvparten av gangene

I det første forsøket fikk 315 deltagere se gjennom 800 bilder av ansikter, 128 av dem var falske. Oppgaven var å skille de ekte fra de falske.

Noen av bildene var enklere å klassifisere enn andre. Her er de som ble best og dårligst klassifisert. (S) står for Syntetic og (R) står for Real, eller ekte. Foto: Farid og Nightingale

Gjennomsnitts-scoren var på 48,2 prosent. Med andre ord kunne deltagerne like gjerne gjettet i blinde. Sjansen for å få rett er 50 prosent.

Men i neste forsøk ga forskerne en ny gruppe forsøkspersoner opplæring i hva man bør se etter for å avsløre falske bilder.

Likevel steg gjennomsnittscoren bare til 59 prosent. Deltagerne fikk også tilbakemeldinger underveis, men det viste seg å ha liten effekt.

Deltagerne var aller dårligst til å skille mellom falske og ekte når det var bilder av hvite menn. Forskerne tror en overrepresentasjon av hvite menn i treningen av algoritmene har gjort modellene ekstra dyktige i å syntetisere nettopp slike bilder.

I et tredje forsøk skulle 223 forsøkspersoner rangere hvor pålitelige de syntes personene på bildene så ut.

Til å stole på

− Ansikter inneholder svært mye informasjon, og vi bruker bare noen millisekunder på å trekke slutninger om personlighetstrekk, som hvor pålitelig vi tror en person er, skriver forskerne.

Hypotesen var at magefølelsen kunne hjelpe oss med å skille falske fra ekte ansikter.

Men svaret er nedslående, snarere tvert imot.

Deltagerne skulle rangere bildene på en skala fra én til syv. Snittscoren på de syntetiske bildene ble 4,82 mot 4,48 på de ekte bildene. Selv om forskjellen bare er på litt under 8 prosentpoeng, er den signifikant, mener forskerne.

De tre ansiktene som ble rangert høyest på en skala fra en til syv, som mest tillitsvekkende er alle syntetiserte, mens de fire med lavest score er alle ekte. Foto: Farid og Nightingale

Det er liten forskjell på hvordan ansikter med ulik hudfarge vurderes, men kvinner oppfattes som litt mer tillitvekkende enn menn. Ansikter som smilte ble i større grad vurdert som pålitelige, men en stor del av både de falske og ekte bildene er av mennesker som smiler, så det alene kan ikke forklare forskjellen, skriver forskerne.

De har likevel en teori.

− Syntetiserte ansikter har en tendens til å se mer gjennomsnittlige ut, noe som i seg selv øker vår tillit til menneskene bak.

Veier risikoen tyngre enn fordelene?

Selv om utviklingen kan regnes som en suksess for teknologene bak, er den ikke uten utfordringer.

Enda mer overbevisende falske profiler på nett, syntetisk lyd og bilde brukt i svindel og desinformasjon, og falske videoer som henger ut eller ydmyker enkeltpersoner. Alt dette kan ha store konsekvenser både for individer, samfunnet og demokratiet, mener forskerne.

− Derfor oppfordrer vi de som jobber med å utvikle denne typen teknologi, til å tenke over om risikoen veier tyngre enn fordelene, skriver de og tar til orde for både retningslinjer og teknologiske løsninger, som vannmerker som avslører falskt innhold.

− Siden en av de største truslene er den etter hvert svært enkle tilgangen til denne typen teknologi, anbefaler vi at man tenker seg om en ekstra gang før man ukritisk og uten restriksjoner deler kode åpent slik at hvem som helst kan bruke det i en hvilken som helst app, skriver forskerne.

Og om du lurte, så viser dette bildet par av lignende ansikter, ekte til venstre og syntetiske til høyre.