(Bilde: ScanStockPhoto)

Gir datamaskiner språkfølelse

Norsk forskers doktoravhandling viser vei mot naturlig språk i automatiserte oversettelser.

Det er utviklet en måte å få en datamaskin til å etterligne menneskets språkfølelse. Språkteknolog Erik Velldal ser for seg at det skal være mulig å gå i dialog med PC-en når den svikter.

Velldal, som er tilknyttet institutt for lingvistiske og nordiske studier ved Universitetet i Oslo (UiO), har bestemt seg for å finne svaret på hvordan man gir datamaskiner en språkfølelse. Og resultatene er å finne i hans doktoravhandling som Velldal forleden forsvarte ved UiO.

Velldals doktoravhandling går inn i et større nasjonalt samarbeidsprosjekt for maskinoversettelse, og metodene som utvikles i avhandlingen er allerede blitt tatt i bruk av andre språkteknologiske forskere internasjonalt.

Problemet med automatiske oversettelser er at datamaskinen returnerer setninger som ikke virker naturlige.

- Som vi alle vet, finnes det ofte mange ulike setninger som kan uttrykke den samme meningen. Da gjelder det å finne en formulering som virker mest mulig flytende og god. De fleste av oss vil si «salt og pepper» fremfor «pepper og salt», selv om meningen er den samme. Det gjelder derfor å få maskinen til å gjenkjenne ulike uttrykk for samme mening, og få den til å velge det uttrykket som virker mest naturlig, sier Velldal.

Han har løst problemet ved å mate datamaskinen med statistiske sannsynlighetsregler for menneskelig språkbruk. Maskinen velger deretter ut setninger som passer best mulig med disse statistiske reglene. Disse reglene er i sin tur avledet fra avanserte lingvistiske analyser av tekster.

Erik Velldal sier at metoden skiller seg fra den som Yahoo benytter seg i sin Babelfish. Her bygges det etter Velldals måte på en gammeldags tilnærming, der det utelukkende er håndskrevne regler som bestemmer hvilke setninger datamaskinen spyr ut.

Språkteknologen har stor tro på at systemer av denne type for eksempel kan brukes til å oversette relativt enkle tekster innenfor et avgrenset tema. Han ser også for seg at slike systemer vil gjøre det mulig for brukerne å gå i dialog med PC-en når den streiker, eller skrive spørsmål inn i Google å få forståelige svarsetninger tilbake.

Og apropos oversettelse og lingvistikk: Under den kalde krigen ble det utviklet en maskin som skulle oversette mellom engelsk og russisk. For å teste maskinen, sendte programmerne et bibelvers gjennom systemet: «The spirit is willing but the flesh is weak». Sitatet ble oversatt til russisk og tilbake igjen, men da var bibelverset blitt til «The vodka is good, but the meat is rotten». (©NTB)

Til toppen