KUNSTIG INTELLIGENS

Googles nye KI-modell kan lage dataspill ved hjelp av ett bilde

DeepMind med nye fremskritt.

Med «Genie» har Google tatt KI-teknologien i nok en ny retning, men modellen er ennå ganske primitiv.
Med «Genie» har Google tatt KI-teknologien i nok en ny retning, men modellen er ennå ganske primitiv. Foto: Google/Deepmind
1. mars 2024 - 16:04

Den pågående utviklingen innen kunstig intelligens (KI) har blitt litt av et kappløp, og de store aktørene konkurrerer om å begeistre publikum.

Nylig presenterte OpenAI en imponerende modell som kan lage svært naturtro videoer med kun tekstinstrukser, og nå varter Google opp med en ny KI-modell som byr på spenstige egenskaper. MIT Technology er blant dem som har skrevet om saken.

Trent på internettvideoer

Den nye modellen, som er utviklet av Googles Deepmind-avdeling, har fått navnet «Genie» og kan lage dataspill kun ved hjelp av ett enkelt bilde, eller eventuelt en tegning.

Riktignok snakker vi ikke om avanserte dataspill som kan matche det som finnes på markedet i dag, men like fullt fungerende, spillbare og interaktive spill – for øyeblikket primært av det todimensjonale, sideskrollende slaget.

Modellen er ifølge Google trent på store mengder offentlig tilgjengelige videoer fra internett.

Å gjenskape et virtuelt miljø basert på stillbilder er ikke nødvendigvis oppsiktsvekkende i seg selv, men som Google peker på er det en helt annen sak å utlede et kontrollsystem kun ved hjelp av visuelle instrukser.

– Det som gjør Genie unik, er dens evne til å lære finmaskede kontrollsystemer eksklusivt fra internettvideoer. Dette er en utfordring fordi internettvideoer som regel ikke kommer med merkelapper som forteller hvilken handling som utføres, eller hvilken del av bildet som skal kontrolleres.

Genie skal altså være i stand til å vite hvilke deler av bildet som generelt er kontrollerbare – og kan også utlede hvilke typer handlinger som kan utføres på mer eller mindre samme måte på tvers av ulike typer genererte miljøer. 

– Begynnelsen på en ny æra

Ifølge Google legger teknologien potensielt til rette for nye måter å generere virtuelle, interaktive miljøer på. Løsningen kan for eksempel kombineres med eksisterende tekst-til-bilde-modeller, som Googles egen bildegenerator Imagen-2, til å lage bilder som deretter kan gjøres levende med Genie.

Eksempler på visuelle instrukser som Google har publisert, omfatter både fotografier av ekte miljøer, håndtegnede skisser og altså datagenererte bilder.

Google tror den nye modellen kan bli begynnelsen på en ny æra, hvor folk uten store tekniske ferdigheter kan lage komplette interaktive miljøer bare ved hjelp av bilder og/eller tekst.

Enn så lenge er nok Genie mest  et «proof of concept», og et fullverdig spill vil naturligvis kreve en vesentlig mer avansert modell, men så er dette også bare starten.

Om man ønsker å fordype seg i de tekniske detaljene om hvordan Genie fungerer, har Google gjort selve forskningsdokumentet tilgjengelig for nedlastning.

Samsungs KI-funksjoner kalles for Galaxy AI og bruker en stor språkmodell til å blant annet oppsummere innhold fra nettsider. I første omgang er det kun Samsungs tre nye flaggskip, som får funksjonene fra høyre: S24, S24+ og S24 Ultra
Les også

Samsungs første KI-mobiler er her: De skal forandre hvordan vi møtes, kommuniserer og skaper

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.