Først kom Open AIs Dall-E 2. Deretter Googles Imagen (som er basert på Open AIs åpne kildekode). Hva handler det om? Jo, bildegeneratorer basert på kunstig intelligens. Alt som kreves av brukeren er at hen skriver inn noen få ord eller enklere fraser. Resultatet er et detaljert bilde eller kunstverk. Men det finnes en begrensning med verktøyene, som Dall-E mini løser.

Hva er Dall-E mini?

Tross navnet er det ikke en oppfinnelse fra Open aAI men en ny AI-basert bildegenerator laget av programvareutvikleren Boris Dayma, med inspirasjon fra Dall-E 2. I motsetning til konkurrentene har han gjort verktøyet fritt tilgjengelig og gratis for alle . Dall-E mini har blitt en viral suksess.

Er det like bra?

Foto: Dall-E mini

Kvaliteten på bildene som genereres av Dall-E mini er ikke like høy som hos de andre. Ansikter kan se uskarpe, forvrengte og nesten klumpete ut.

– Bildet er kodet i en veldig kort tallsekvens, slik at modellen kan lære raskere. Dette gjør at modellen gjør mange feil. Men du kan tegne månen, et landskap eller et tre uten å merke noe rart, sier Boris Dayma til BBC Science Focus.

Han mener modellen er like god eller dårlig på alle slags bilder, men at vi legger mye mer vekt på hvordan et ansikt blir, for eksempel hvis en nese er skjev eller øynene feil.

Men ved å skrive lange og mer detaljerte kommandoer om ting som hvor og hvor store deler av ansiktet skal være, har brukerne klart å omgå problemet.

Kan du få bilder av hva som helst?

Verktøyet har ingen grenser for hva du kan be det om å lage, på godt og vondt. BBC Science Focus forklarer at du for eksempel kan bruke Dall-E mini for å få et bilde av kjente tegneseriefigurer som snakker under en Ted Talk, men også for å få rasistiske eller voldelige bilder. Dall-E mini har ikke noen sikkerhetsprotokoll på plass, i motsetning til Imagen og Dall-E 2.

Foto: Dall-E mini

Hva lager folk?

Når Boris Dayma vil se hva folk har gjort med verktøyet hans, scroller han vanligvis på Twitter. Han er spesielt glad i begrepet «trail cam», som gir kornete bilder som ser ut til å være tatt om natten med et lavoppløselig kamera. Det som har imponert ham mest, er brukernes kreativitet.

– Jeg har skrevet inn for eksempel utsikt fra en innsjø under måneskinn, eller Eiffeltårnet på månen, det var mine mest komplekse kommandoer. Men når jeg ser hva folk bruker dette til, blir jeg overrasket. Jeg har ikke dette nivået av kreativitet, og brukerne lærer å vri på modellen for å lage virkelig spesifikke kommandoer som jeg aldri ville ha kommet på, sier han til BBC Science Focus.

Har du lyst til å prøve? Her finner du Dall-E mini.

Denne artikkelen ble først publisert på Ny Teknik.