Norsklærere: Elever fra første klasse ved Ullern Videregående skole sørger for at Watson ikke bommer på substantiv og verb. (Bilde: ORV)

IBM WATSON

Nå skal IBM satse hardt på Watson i Norge

Første post: Å lære den norsk.

IBM har blitt medlem av OCC - Oslo Cancer Cluster. Teknologigiganten stiller sin berømte, analytiske datatjeneste Watson til tjeneste for norske kreftleger og kreftforskere.

IBMs Watson-satsing blir etablert hos OCC, som er plassert i en nytt bygg ved siden av forskningsbygget på Radiumhopitalet.

To etasjer under OCC finner vi Ullern videregående skole. En ganske spesiell, og helt bevisst plassering.

OCC er et senter for bedrifter, forskere og andre som driver med kreftforskning. Det å være samlokalisert med en videregående skole gir mange tilleggseffekter for begge parter.

Ikke minst for skolen, som har en policy om å samarbeide med forskning og næringsliv. Her vil de at elevene skal få tettere kontakt med de utfordringer som møter dem når de skal ut i studier og jobb.

Skal være norsklærere

Nå skal 14 elever ved Ullern Videregående hjelpe IBM med å få Watson til å forstå norsk språk.

I første omgang med å lese norsk. Det vil norske kreftforskere og kreftpasienter få glede av.

Folk i IBM har gjort litt selv og læringsmodulen i Watson-systemet er fôret med den norske ordboken.Men det holder ikke med å pugge en ordbok, selv om den i Watsons tilfelle sitter spikret 100 prosent.

Må rettes: Elevene får presentert Watsons fortolkning av tekster i et regneark og må gripe inn om datasystemet har bommet på ordklasser.
Må rettes: Elevene får presentert Watsons fortolkning av tekster i et regneark og må gripe inn om datasystemet har bommet på ordklasser. Foto: IBM

For å forstå hva det snakkes om må Watson skjønne kontekst også. Mange ord kan f. eks. være både et substantiv og et verb. Det kommer an på konteksten.

Ordet leke er et godt eksempel på at det ikke holder med et oppslag i ordboka. Skal den bli flinkere til å forstå norsk må den på skolebenken, og det er her elevene skal rettlede det revolusjonerende datasystemet slik at det kan hjelpe norske pasienter.

– Vi ser på et stort antall setninger i Excel som Watson allerede har lest og prøvd å forstå. Programmet har merket hva det mener er substantiv, verb, adjektiv, pronomen og slikt - og som oftest har maskinen truffet riktig. Vår jobb er å være sensorer og sjekke om Watson har rett eller feil. Alle feil blir matet tilbake, slik at Watson kan lære og forbedre seg, sier Marie Wahlstrøm.

Hun valgte Ullern på grunn av realfagsundervisningen og synes det er litt av en utfordring for en 17-åring å få være med på å trene et datasystem i norsk.

Dr. Watson

IBM datasystem ble verdensberømt i 2011 da det slo de to amerikanske mesterne i kunnskapskonkurransen Jeopardy.

Det var først og fremst et PR-stunt, for IBM hadde ikke bygget en spillmaskin. De hadde bygget et system som kunne absorbere enorme kunnskapsmengder og se mønstre som mennesker knapt kunne drømme om.

Medisin, og spesielt kreftdiagnose og terapiforslag, var en av de første praktiske anvendelsene som nå brukes i USA og en rekke andre land.

Nå skal Watson etableres i Norge, og da må den engelskspråklige maskinen lære seg å lese norsk.

Norden er unikt

IBM er interessert i Norge av flere årsaker. De nordiske landene er unike i måten de har data om kreft hos alle pasienter tilbake til 50-tallet.

Norge startet opp med slik registrering i 1951. I tillegg har Norge et svært godt miljø innen kreftforskning, og mange nye bedrifter er etablert her.

 – Dette er første gangen IBM har brukt skoleungdom til denne typen oppgaver. Her baserer vi oss på elevene for å få på plass bredden i det norske språket. Vi benytter tekstfiler fra Språkbanken som Nasjonalbiblioteket har tilgjengeliggjort. De er åpent tilgjengelige, og dekker den språklige bredden vi trenger.

– Det norske språket er en utfordring fordi vi i motsetning til på engelsk bruker så mange sammensatte ord. Men innen medisin holder det ikke med generell norsk. For å få Watson til å skjønne medisinsk terminologi trenger vi også leger for å hjelpe oss. Innen det medisinskfaglige språket, og spesielt på kreftområdet, får vi hjelp fra all den faglige språkkunnskapen som er tilgjengelig for Watson. Her er det gjort mye arbeid i USA og andre land, og mye av denne terminologien er internasjonal, sier IT-arkitekt i IBM og ansvarlig for å lære Watson å forstå norsk, Pål Backe.

Når Watson har bygget opp i en norskforståelse på mer enn 95 prosent er den i stand til å analysere ustrukturert tekst.

Da kan man begynne jobben med å mate systemet med store mengder medisinsk litteratur, journaler og mye annet.

Spesiell plassering

Samarbeider med OCC. Assisterende rektor Ester Eriksen noterer med stor tilfredshet at antallet samarbeid mellom skolen og forskning og næringsliv øker raskt.
Samarbeider med OCC. Assisterende rektor Ester Eriksen noterer med stor tilfredshet at antallet samarbeid mellom skolen og forskning og næringsliv øker raskt. Foto: ORV

– Rollen som norsklærere er bare en av flere oppgaver elever har hatt sammen med OCC, og jeg regner med at det blir flere av dem, sier assisterende rektor Ester Eriksen.

Ifølge henne er den samlokaliseringen de har med et sykehus og et forskningsmiljø så langt de vet unik i verden. De utfører prosjektet sammen og de spiser i samme kantine.

– Vi føler at dette er mer enn en vanlig skole, sier Knut Ervik.

– Når vi kommer inn i kantina her så oppfører vi oss nok bedre enn ved andre skoler. Det er jo mye voksne og kompetente folk her, legger Thomas Solem til.

Tre av de fire ungdommene har bestemt seg for å ta realfag, mens Helene Hunter vil velge samfunnsfag. Det synes assisterende rektor er helt OK.

Det skal mer enn realister til å bringe landet videre. Det viktigste er at elevene har engasjement og vilje til å studere og delta i prosjekter. De er det mange av.

Fra 2009 frem til i fjor deltok elevene i 60 prosjekter med næringsliv og forskning. Hittil i år er antallet kommet opp i 25.

Kommentarer (3)

Kommentarer (3)
Til toppen