(Foto: Bjarne Roesjoe)

Kunstig inteligens og big data

Sånn skal kunstig intelligens hjelpe Norge med å finne olje

 

Torsdag åpnet SIRIUS-senteret i Oslo. Senteret finansieres av Norges forskningsråd.

Målsetningen er å bringe ledende selskaper innen olje-, gass- og IT-sektoren sammen med forskningsmiljøene.

Universitetet i Oslo, NTNU, Simula Research Laboratory og Universitet i Oxford står alle på lista over samarbeidspartnere.

SIRIUS-prosjektet har som mål å løse dataalderens tøffeste utfordring – å finne og sammenstille ulike data i en verden hvor datamengden og kompleksiteten øker kraftig. Prosjektet vil løpe over åtte år og har en totalramme på nærmere 300 millioner kroner.

Verdens fremste ekspert

I forbindelse med åpningen av SIRiUS-senteret har IBM, som er en av samarbeidspartnerene til prosjektet, invitert en av verdens mest ledende forskere innen kunstig intelligens til Oslo.

Undersøkelser viser nemlig at oljeingeniører kan bruke opptil 70 prosent av tiden på å finne og sammenstille data for å utføre jobben.

– For å analysere store datamengder trenger man en maskin som forstår big data. Olje og gass har ofte slitt med stor risiko og usikkerhet. Det har ikke bare med oljepris å gjøre, men også når det kommer til å finne oljen. Hva finnes under bakken, og hva vil være den beste måten for å utvinne den? Der kan big data og kunstig intelligens hjelpe industrien mye, sier direktør for forskning og utvikling innenfor kognitiv databehandling, Lisa Amini, hos IBM til digi.no.

Amini har blant annet ansvaret for forskningen når det kommer til å lære datamaskinene algoritmer og systemer for maskinlæring og semantisk analyse. Hun har særlig kunnskap om masseanalysering av strukturert og ustrukturert data.

Lisa Amini i IBM. Foto: IBM
– Målet vårt er at man skal kunne ta bedre beslutninger basert på data som samles inn, sier hun til digi.no.

Big data ikke kunstig inteligens

IBM har ikke valgt å kalle Watson-prosjektet for kunstig intelligens.

- Grunnen til det er at vi først om fremst støtter oss på big data. Vi ser gjennom prosjektene vi jobber med at big data er selve fundamentet. Verdens ide av kunstig intelligens er at man tar det et menneske vet, putter det i datamaskinen for så å kunne spørre den om spørsmål som den skal kunne svare på som en ekspert. Problemet med disse systemene er at menneskene i så fall må overlevere denne informasjonen. Dermed var det hverken skalerbart eller mulig å gjennomføre, forklarer hun.

IBM har skjønt at den beste måten å videreformidle informasjon til maskinen på, er ved å la den stå for læringen selv.

– Hvordan tar vi bilder som mennesker kan se, og får maskinen til å skjønne det vi ser? Hvordan får vi den til å skjønne hva bilder eller video betyr? Det er den store og viktig delen av denne prosessen med maskinlæring. Det er viktig å sørge for at maskinen selv får jobbe med mønstergjenkjenning slik at de virkelig lærer hva som skjer, oppsummerer hun.

Selskapet mener også at det ikke nytter å lære maskinene å tenke selv på den gammeldagse måten der man gir maskinen en kommando hvor den svarer med noe annet I/O.

Stort paradigmeskifte

– Hva vi lærte av big data, er at vi må lære maskiner å lære. Om vi gir de mange nok bilder av en hund vil den til slutt gjenkjenne en hund. Skal vi gi maskinene intelligens må man gjøre det på mer naturlige måter enn tradisjonell programmering. Selv om man snakker om enorme datamengder, vil man aldri klare å mate maskinen med nok informasjon, men om man lar de lære selv blir de nødt til å analysere og vil på den måten lære. Når vi sier kognitiv maskinlære snakker vi om noe som er dataorientert, og om systemer som skjønner hva mennesker skjønner, argumenterer hun til digi.no.

Amini ser for seg et stort skifte innenfor hvordan man programmerer datamaskiner i fremtiden.

– Mye mer av det vi gjør for å få maskinene til å utføre oppgaver er å trene de opp. Trening er en ny form for programmering. Det handler ikke om å mate maskinen med dokumenter, men hvordan man mater maskinene med informasjon. Det som ofte skjer er at man gir maskinene informasjon som de skjønner, og ikke skjønner. Man kan på en måte kalle det støy. Vi jobber nå med å få maskinene til å skjønne forskjellige perspektiver, argumentasjonsrekker og beslutningstaking ved hjelp av måtene maskinene allerede jobber på, via mønstergjenkjenning og dataanalyse, forklarer hun. 

– Tror du det går an å emulere den digitale støyen på en måte?

– Det handler om å forstå hva som er relevant og ikke. Problemet er at noe er støy i en situasjon, og informasjon i en annen. Det er viktig at vi jobber med å strukturere dataene så godt vi kan og prøver å få maskinen til å forstå hva som er relevant i forhold til den oppgaven den skal utføre, forklarer hun til digi.no.

Fremtiden er her nå

Forskningsdirektøren mener at fremtiden allerede er her.

– Et hett tema nå er dyp læring som er en ny form for maskinlæring i forhold til det vi hadde før. Ta bilder som eksempel. Før kunne maskinene se på et bilde og avgjøre om det var en hund eller katt. Ganske enkel klassifisering altså. Med dyp læring kan vi se på bilder av hud for å avgjøre om det for eksempel er kreft. Er det viktig å kunne se forskjell på en hund og og en katt? Om man tenker på det, så er det faktisk det. Noen ganger klarer ikke en gang mennesker å skille på hva det er de ser, rett og slett fordi de mangler kunnskapen. De har ikke sett hunde- eller katterasen før, og kan derfor ikke avgjøre hva det er. Alt dette er eksempler på dyp læring, sier Amini.

Men man er fortsatt langt unna maskiner som skjønner hva etikk, kreativitet og moral er.

– Vi klarer å gjøre mer og mer informasjon beregningsdyktig. Om vi tar kreativitet så handler kreativitet om å identifisere muligheter og finne det som er mest relevante for målet. På en måte kan vi få maskinen til å hjelpe oss med kreative oppgaver. Chef Watson viser at maskinen kan emulere kreativitet ved at den finner smaker som passer godt sammen. Om man gir en datamaskin nok eksempler som er tilfredsstillende for oss mennesker, vil det være mulig å generere tilfredstillende kunst for oss mennesker. Målet er ikke å erstatte kunstnere eller kokker, målet er å gi dem muligheter de ikke hadde sett selv.

Derfor er det så vanskelig

– Hvor lang tid tar det for maskinen å lære seg noe nytt?

– Maskinene lærer seg ting på forskjellige måter. Noen ganger ved å være deskriptive. Men vi er ikke komme så langt at vi kan vise roboten en film som den lærer av med en gang - det er ennå en stund til vi er der. Men det er mye forskning som pågår nå som jobber med å løse dette problemet.

– Hvorfor er det så vanskelig å løse?

– Om du tenker deg at du skal prøve å lese et dokument og gjøre all den informasjonen beregningsdyktig. Det er vanskelig. Først må man kunne kjenne igjen entitetene som finnes i dokumentet. Maskinen må forstå konseptene som presenteres. Menneskene, steder, tid, hendelser, alle slike ting. Om maskinen gjenkjenner at man diskuterer John Kelly, så må den klare å skille forskningssjefen i IBM fra alle andre John Kellyene som finnes. Et annet aspekt er at man ikke bare vil vite hva som presenteres, man vil også vite i hvilken sammenheng det presenteres. Maskinen må forstå hva ting egentlig betyr. Å presentere og forstå all den informasjon er noe vi jobber mot. Det fine med dette er at med en gang man har lært maskinen noe, har man lært alle det. Man kan dermed lære alle maskiner det beste av det menneskelige eksperter vet, sier IBM-eren til digi.no.

Men hvor langt har dette forskningsfeltet egentlig kommet på alle disse årene det har snakke om kunstig intelligens.

– Maskinene vil ikke ta over

– For å ta et eksempel brukte vi bildegjenkjenningsanalyse som skulle kunne skille mellom en fotballkamp og et nyhetsinnslag. Alle disse bildeklassifisørene var en rekke PhD-teser bare for å prøve å forstå hvordan man lager algoritmer for å kjenne igjen ting fra bilder. Nå jobber vi med å utvide algoritmene så maskinene selv kan velge hvilken metode som er best for å lære seg noe. Det er et enormt fremskritt.

Men vil vi etterhvert bli helt utklasset av maskinene? Amini tror ikke det.

– Jeg tror vi kommer til å ha bedre jobber der vi har mer kunnskap. Vi ser at når man prøver å lage ny teknologi så gjør man det fordi vi selv ønsker å bli bedre. Vi gjør det ikke for å ta oss bort i fra ting vi i utgangspunktet liker å gjøre. Det finnes klart ting mennesker ikke er så effektive på, eller liker å gjøre, og som vi kan bruke maskiner til å gjøre bedre. Enda er vi veldig langt unna. Det vi mennesker kan gjøre, tenke og føle vil ta veldig lang tid å få en maskin til å emulere. Jeg tror uansett ikke at vi kommer til å lage noe som ligner på et menneske med alt det innebærer, sammenfatter hun.

Til toppen