En AI-robot lærte seg selv opp til å spille videospill – nå har den for første gang vunnet mot mennesker

Illustrasjonsfoto.

6. aug. 2019 - 06:00

Amit M. Joshi, professor i digital markedsføring og strategi ved IMD, og Maude Lavanchy, stipendiat ved IMD

Siden de tidligste dagene med virtuell sjakk og virtuell kabal har videospill vært et utviklingsområde for å utvikle kunstig intelligens, såkalt AI. Hver seier som maskiner har vunnet mot mennesker, har bidratt til å gjøre algoritmene smartere og mer effektive. Men for å håndtere utfordringer i den virkelige verden – for eksempel det å automatisere komplekse oppgaver som kjøring og forhandlingssituasjoner – må disse algoritmene navigere i mer komplekse omgivelser enn brettspill, deriblant ved å lære teamarbeid. Å lære kunstig intelligente roboter hvordan man jobber og samhandler med andre spillere for å kunne oppnå noe, har vært en uoverkommelig oppgave – inntil nå.

Amit M. Joshi, professor i digital markedsføring og strategi ved IMD. Foto: IMD

I en ny studie har forskere laget en detaljert måte å trene AI-algoritmer på for å nå menneskelige prestasjonsnivåer, og det har de gjort ved hjelp av et populært flerspillerspill i 3D – en modifisert versjon av Quake III Arena i Capture the Flag-modus.

Selv om oppgaven i dette spillet er enkel og likefram – to lag konkurrerer om å fange hverandres flagg ved å navigere i et kart – krever det å vinne kompleks beslutningstaking og en evne til å forutsi og reagere på handlingene til de andre spillerne.

Dette er første gang en AI-robot oppnår menneskelignende ferdigheter i et førstepersons videospill. Så hvordan klarte forskerne å få til det?

Robotens læringskurve

I 2019 er flere milepæler nådd i AI-forskningen ved hjelp av andre flerspillerstrategispill. Fem “boter” – spillere kontrollert av en AI-robot – beseiret et profesjonelt e-sportslag i et spill kalt DOTA 2. Profesjonelle menneskelige spillere ble også slått av en AI-robot i et spill kalt StarCraft II. I alle tilfeller ble det brukt en form for forsterkningslæring, der algoritmen lærer ved prøving og feiling og ved å samhandle med omgivelsene.

De fem botene som vant over menneskene på DOTA 2, lærte ikke å spille av mennesker – de ble trent utelukkende ved å spille kamper mot kloner av seg selv. Forbedringene som gjorde at de kunne beseire profesjonelle menneskelige spillere, kom fra skalering av eksisterende algoritmer. På grunn av datamaskinens hastighet kan en kunstig intelligent robot i løpet av noen sekunder spille et spill som tar minutter eller timer for mennesker å spille. I løpet av ti måneder i sanntid hadde forskerne dermed kunnet trene sin AI-robot i 45 000 år med spilling.

En selvlært AI-robot som er i stand til å vinne over menneskene på deres egen hjemmebane, er et spennende gjennombrudd som kan endre vårt syn på maskiner

Capture the Flag-boten fra den ferske studien begynte også å lære fra grunnen av. Men i stedet for å spille mot sin identiske klone ble det dannet en gruppe på 30 boter, som ble trent gjennom å være parallellkoblet med et internt belønningssignal. Hver bot i denne gruppen ville da spille sammen og lære av hverandre. Som David Silver – en av de involverte forskerne – bemerket, begynner AI-roboten å "fjerne begrensningene ved menneskelig kunnskap... og å skape kunnskap på egen hånd".

Læringshastigheten for mennesker er fremdeles mye raskere enn de mest avanserte algoritmene i forsterkningslæren. Både OpenAI sine boter og DeepMinds AlphaStar (boten som spiller StarCraft II) trengte tusenvis av år med spillerfaring før de nådde et menneskelig prestasjonsnivå. Slik trening anslås å koste flere millioner dollar. Likevel er en selvlært AI-robot som er i stand til å vinne over menneskene på deres egen hjemmebane, et spennende gjennombrudd som kan endre vårt syn på maskiner.

Framtiden til mennesker og maskiner

En AI-robot blir ofte fremstilt som noe som erstatter eller utfyller menneskelige evner, men sjelden som et fullverdig teammedlem som kan utføre samme type oppgaver som mennesker. Siden disse videospilleksperimentene innebærer et samarbeid mellom menneske og maskin, gir de dermed et glimt av framtiden.

Menneskene som spilte Capture the Flag, vurderte botene som mer samarbeidsvillige enn andre mennesker, mens de som spilte DOTA 2, hadde en blandet reaksjon fra møtet med sine AI-lagkamerater. Noen var entusiastiske, og sa at de fikk støtte fram dem og lærte å spille sammen med dem. Sheever, en profesjonell DOTA 2-spiller, snakket om sin erfaring med å være på lag med boter:

Ettersom kommunikasjon er en pilar i ethvert forhold, vil forbedringen av kommunikasjonen mellom mennesker og maskiner være avgjørende i framtiden

“Det føltes faktisk fint; [AI-lagkameraten] ga livet sitt for meg på et tidspunkt. Han prøvde å hjelpe meg, og tenkte at ‘jeg er sikker på at hun vet hva hun gjør’, da jeg tydeligvis ikke gjorde det. Så du skjønner, han trodde på meg. Det er ikke noe som mine [menneskelige] lagkamerater ofte gir uttrykk for.”

Andre var mindre entusiastiske. Men ettersom kommunikasjon er en pilar i ethvert forhold, vil forbedringen av kommunikasjonen mellom mennesker og maskiner være avgjørende i framtiden. Forskere har allerede tilpasset noen funksjoner for å gjøre botene mer "menneskevennlige". For eksempel kan de ved hjelp av sin kunstige intelligens vente på å velge ut sin spillkarakter under en lagutvelgelse, slik at de unngår å legge unødig press på de menneskelige spillerne.

Men skal kunstig intelligente roboter lære av oss eller fortsette å lære seg selv? Selvlæring uten å imitere mennesker kan lære AI-robotene mer effektivitet og kreativitet, men det kan også skape algoritmer som er mer passende for oppgaver som ikke involverer menneskelig samarbeid, som for eksempel for lagerroboter.

På den annen side kan man argumentere med at det å ha en maskin som er trent av mennesker, ville være mer intuitivt – mennesker som anvender slike kunstig intelligente roboter, kunne forstå hvorfor en maskin gjorde det den gjorde. Uansett, etterhvert som AI-robotene blir smartere og smartere, vil vi nok alle møte på flere overraskelser.

Denne artikkelen ble først publisert av The Conversation.

Debatt Kunstig intelligens

Kommentarer:

Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.

Se flere jobber

Fra usikker student til ombruksrådgiver i bærekraftig byggebransje!

Les mer