Stor oppdatering gjør ChatGPT enda mer menneskelignende

Kan nå snakke og gjenkjenne bilder.

ChatGPT utvides stadig med nye funksjoner, og nå har den fått et par nye ferdigheter som nok vil heve nytteverdien betraktelig. Illustrasjonsfoto: Markus Mainka/Colourbox/59868782

Eigil Knudsen

26. sep. 2023 - 19:00

ChatGPT lagde store bølger da den først ble lansert, men siden den gang har OpenAI jobbet hardt med å forbedre tjenesten og bygge inn nye funksjoner. Nå har selskapet sluppet en av de aller mest betydningsfulle oppdateringene til ChatGPT så langt.

På nettsidene sine kan OpenAI nå meddele at den populære snakkeroboten har fått evnen til å nettopp snakke. Dette er imidlertid ikke den eneste nyheten, for ChatGPT kan nå også gjenkjenne – og diskutere – bilder.

De nye funksjonene rulles ut til Plus- og Enterprise-brukere av tjenesten i løpet av de neste par ukene, og til andre brukere kort tid senere. Stemmebasert kommunikasjon kommer også til de mobile plattformene iOS og Android, mens bildegjenkjenning vil komme til alle plattformer.

Med den nye bildefunksjonen kan ChatGPT forstå innholdet i bilder og gi meningsfulle tilbakemeldinger, som i dette eksempelet. Foto: OpenAI

Profesjonelle stemmeskuespillere

OpenAI har ikke spesifisert hvilke språk de nye funksjonene støtter utover engelsk, så det er uvisst om eller når støtte for norsk vil være på plass fra begynnelsen, eller eventuelt komme senere. Norsk er blant språkene som ChatGPT offisielt støtter til tekstkommunikasjon.

Støtte for stemmekommunikasjon innebærer at man heretter vil kunne kommunisere med ChatGPT på omtrent samme måte som man kommuniserer med andre mennesker, og ha en naturlig samtale.

På samme måte som at man i dag kan be ChatGPT om å skrive et dikt eller en historie, kan man altså nå få servert diktene eller historiene i verbal form. OpenAI opplyser at de har jobbet med profesjonelle stemmeskuespillere for å lage stemmene.

Funksjonen bygger på en helt ny tekst-til-stemme-modell som er i stand til å generere menneskelignende audio fra tekst og kun noen få sekunder med tale. Den benytter seg også av Whisper til transkripsjoner fra tale til tekst. Whisper, som ble introdusert i september i fjor, er en modell for talegjenkjenning som blant annet kan brukes til oversettelser, transkripsjoner og tale-til-tekst.

ChatGPT er blant annet nyttig til å skrive dokumentasjon til etablerte koder og til å koble to ulike programmeringsteknikker, mener forskere ved Universitetet i Oslo.

Les også:

Slik gjør ChatGPT forskerne mer effektive

Kan nå også analysere bilder

Den andre nyheten er kanskje enda mer interessant, nemlig den nye bildegjenkjenningsfunksjonen. Med denne funksjonen kan ChatGPT analysere bilder som brukeren viser snakkeroboten, og komme med meningsfulle tilbakemeldinger og beskrivelser av hva den ser.

Denne funksjonaliteten kan for eksempel brukes til å be ChatGPT om å hjelpe deg å reparere produkter som man kanskje ikke er helt komfortabel med å fikse på egen hånd. Ved å simpelthen vise snakkeroboten et bilde av hva man jobber med, kan den respondere med hvordan man bør gå frem, basert på hva som finnes i bildet.

I et eksempel som OpenAI la ut ble ChatGPT vist et bilde av en verktøykasse, og basert på dette kunne den identifisere de riktige verktøyene for en spesifikk oppgave som brukeren jobbet med – i dette tilfellet justering av et sykkelsete. Bildene kan man simpelthen ta med mobilkameraet og legge inn i samtalen i mobilapp-versjonen av ChatGPT.

Mer informasjon om de nye funksjonene kan man finne på OpenAIs nettsider.