Google vil satse bredt på statistisk oversettelse

Google har gode erfaringer med en egenutviklet metode for maskinbasert oversettelse.

De siste årene har unge (35 år) tyske Franz Ochs ledet arbeidet i Google med maskinbasert oversettelse av dokumenter. Han har valgt en metode kjent som statistisk maskinoversettelse, og ledet utviklingen av egne algoritmer.

Metoden går ut på å fore maskinoversetteren med eksempler på oversatt tekst. Statistisk analyse brukes til å identifisere hva som er de mest sannsynlige oversettelsene av en gitt følge av ord. Ideen er at jo flere eksempler man har, desto flinkere blir programmet til å velge riktig oversettelse når den skal behandle ukjent tekst.

Tekstene stammer fra oversettelser gjort av eksperter i FN og EU. For hvert språkpar må systemet fores med parallelt oversatt tekst med mange hundre millioner ord, for å gi det et tilstrekkelig grunnlag til å fungere hensiktsmessig.

Statistisk maskinoversettelse er et alternativ til mer lingvistiskorienterte metoder, der man angir grammatiske regler som programmet skal følge i sin oversettelse.

En tidlig utgave av Googles teknologi ble med på en evaluering hos USAs standardiseringsinstitutt National Institute of Standards and Technology i august 2005, og kom best ut. Evalueringen gjaldt toveis oversettelse mellom henholdsvis engelsk og arabisk, og engelsk og kinesisk. Se: NIST 2005 Machine Translation Evaluation Official Results.

Det understrekes at metoden ikke gir perfekte oversettelser. Hensikten er å lage oversettelser som er forståelige og som kan brukes til å vurdere innholdet i et dokument på et språk man ikke forstår.

Erfaringen er at metoden gir resultater som er langt bedre enn andre metoder for maskinbasert oversettelse. Innholdet gjengis noenlunde korrekt, selv om uttrykket kan oppfattes som klossete.

Googles egen tjeneste for automatisk oversettelse, brukes statistisk maskinoversettelse i dag på språkparene engelsk-arabisk, engelsk-kinesisk og engelsk-russisk.

Google-sjef Eric Schmidt ser for seg at statistisk maskinoversettelse vil brukes på alle de andre språkparene tjenesten tilbyr. Han mener tilfredsstillende systemer for automatisk oversettelse vil bidra til å bryte ned språkbarrierer verden over.

Til toppen