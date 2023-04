Ved siden av motorveiene der giganter som Open AI, Microsoft og Google brøler frem i stadig økende hastighet, finnes det AI-oppstartsselskaper som på ulike måter bruker generativ teknologi og språkmodeller. Generativ betyr at den ikke bare tolker informasjon, men også skaper originalt innhold. For hver dag som går ser det ut til at de blir flere, og det begynner allerede å bli umulig å holde styr på alt som skjer.

Claude: Chatbot

Oppstartsselskapet Anthropic lanserte chatboten Claude i mars 2023. Anthropic er grunnlagt av tidligere ansatte ved Open AI. Noe som gjør at selskapet skiller seg ut i mengden, er at de er så tydelige på at de forstår det såkalte alignment- eller kontrollproblemet. Så hvordan sikre at AI – både nå, men spesielt hvis den når generell intelligens – har mål som ikke avviker fra menneskehetens.

Claude sies derfor å ha mindre sannsynlighet for å generere rasistisk eller sexistisk innhold, har en tendens til å hallusinere mindre og sies å unngå å gi råd om ting som for eksempel ulovlige aktiviteter. For å lykkes med dette har Anthropic bygget et rammeverk de kaller «constitutional ai», hvor Claude må innrette seg etter en rekke etablerte prinsipper.

Chatboten Claude er blant annet integrert i appen Poe. Illustrasjon: Poe

I løpet av betafasen viste det seg imidlertid at ikke engang Claude helt kan følge målene Anthropic ga chatboten. For eksempel fikk en testbruker instruksjoner om hvordan han skulle gå frem for å lage metamfetamin hjemme.

Likevel har selskapene bak verktøy og plattformer som Notion, Quora og Duckduckgo tatt Anthropics AI inn i produktene sine. Og Google har investert 300 millioner dollar i oppstartsselskapet.

ACT-1: Kan handle på Internett

Adept er et selskap å holde øye med. For det første har gründerne ekspertise fra Google og Open AI. For det andre står to av dem – Ashish Vaswani og Niki Parmar – bak den vitenskapelige artikkelen som førte til de senere årenes enestående AI-gjennombrudd. Artikkelen med tittelen «Attention is all you need» fra 2017 beskrev en transformatorarkitektur med en oppmerksomhetsmetode.

For den tredje? Jo, Adept vil ikke bare at kunstig intelligens skal kunne lese og skrive, men også handle på internett. Deres første modell, ACT-1 (action transformer-1), fungerer som en plugin for Chrome-nettleseren og kan klikke, skrive og scrolle. Med tiden forestiller Adept seg at vi ikke taster inn det vi leter etter på nettet – men overlater den oppgaven til chatboten vår, ved å snakke med den.

Dette er selvsagt ikke en ny idé, og vi ble servert de samme løftene da stemmeassistenter i smarthøyttalere var populære. Men som allehar lagt merke til, er dagens AI-modeller veldig mye kraftigere og dyktigere.

Gen 2: Video til video

Stable Diffusion er, sammen med Midjourney og Dall-e, den mest kjente tekst-til-bilde-generatoren. Nå har selskapet bak Stable Diffusion, Runway, gitt ut Gen-2. Det er en video-til-video-generator.

Brukeren kan ta en eksisterende video og transformere den ved bare å beskrive i tekst hva man ønsker. Filtre, masker og annet kan legges til ved å beskrive resultatet du leter etter via tekst og/eller bilde.

Til venstre er et bilde fra den opprinnelige videoen, til høyre resultatet etter noen beskrivelser av hva man ønsker. Illustrasjon: Runway

Harvey AI: Rettshjelp

Dette er en AI-modell basert på GPT-4, tilpasset jussen. Allen & Overy, et av Englands største advokatfirmaer, har betatestet Harvey siden november 2022. Rundt 3500 av deres ansatte har stilt Harvey rundt 40.000 spørsmål i testfasen, om alt fra kontraktsanalyse og due diligence til etterlevelse av regelverk.

Allen & Overy mener at Harvey, basert på store datamengder, vil kunne generere innsikt, anbefalinger og spådommer, som så gjennomgås av en menneskelig advokat.

– Jeg har aldri sett noe lignende som Harvey før. Det er en gamechanger som kan slippe løs kraften i generativ AI for å transformere industrien vår. Under testingen vår så vi noen fantastiske resultater, sier David Wakeling, leder for markedsinnovasjon hos Allen & Overy, i en pressemelding.

Macwhisper: Transkribering

For mange forskere og journalister er det en tidkrevende oppgave å transkribere tale til tekst. De siste årene har det dukket opp en rekke AI-løsninger som har det til felles at de ikke har vært særlig gode. Macwhisper er imidlertid et skritt i riktig retning. Den bygger på Open AIs transformatorbaserte tale-til-tekst-modell Whisper.

Vi serverte Macwhisper et timelangt intervju på svensk med dårlig lydkvalitet, og det fungerte overraskende bra. I tillegg betaler du en engangssum for verktøyet, og transkriberingen skjer lokalt på datamaskinen.

Et alternativ hvis du ikke bruker en Mac-datamaskin – som også er basert på Whisper – er danske Good Tape.

Midjourney: Tekst-til-bilde

Generert innhold i form av illustrasjoner og bilder forbindes ofte med Open AIs Dall-e. Spørsmålet er imidlertid om ikke konkurrenten Midjourney – i alle fall når dette skrives i mars 2023 – er den hvasseste. Versjon 5 av deres AI-modell kan generere så realistiske bilder at det er nesten umulig å si om de er ekte eller ikke.

Denne personen finnes ikke. Bildet er laget med AI-verktøyet Midjourney, som genererer bilder så realistiske at det er nesten umulig å avgjøre om de er ekte. Illustrasjon: Midjourney

Synthesia: Tekst-til-video

Legg til tekst. Ut kommer en video med en slående menneskelik avatar. Videoen kan utformes med ulike typer visuelt formspråk, egne logoer og bakgrunnsmusikk. Vi har forsøkt å generere en kort videosnutt på svensk, men der det var ikke særlig vellykket.

Synthesia lar deg lage video kun ved å legge inn tekst. Illustrasjon: Synthesia

Artikkelen ble først publisert på Ny Teknik