Heretter snakker robotene som mennesker

- Nå kommer teknologi som får kunstig tale til å låte helt naturlig, forteller toppsjef i Lernout & Hauspie, Gaston Bastiaens. Han tror språkteknologi nå står foran det endelige markedsgjennombruddet.

Demonstrasjonene som den opprinnelige belgiske språkspesialisten Lernout & Hauspie viser her på CeBIT-messen i Hannover, er svært overbevisende. En tiltalende kvinnestemme leser opp meldinger og tekst på ulike språk med korrekt uttale og intonasjon. Det hoppes mellom koreansk og flamsk, amerikansk og fransk.

Her er ingenting igjen av den tidligere flate robottalen. Stemmen faller naturlig ved punktum, avslutter spørsmål slik at du hører spørsmålstegnet, og finner fram til den korrekte uttalen av ord som staves likt men lyder forskjellig, avhengig av sammenhengen. Ordet "read" kommer riktig ut i begge setningene "the book I read last night" og "the book I will read tomorrow".
- Språkteknologi består grunnleggende sett av fire ulike gjøremål, sier Bastiaens. - Det er talekompresjon, talegjenkjenning, oversettelse mellom forskjellige språk og lesing av tekst. Disse funksjonene til sammen gir det vi kaller "natural language understanding", naturlig språkforståelse i informasjonssystemer.


Kompresjon spiller en viktig rolle, ikke bare i mobil kommunikasjon. Nye løsninger krever at stadig mer intelligent taleteknologi må nøye seg med stadig mindre datakraft og lagringsplass. Et samarbeid med Intel rundt StrongArm-prosessoren viser at det som i dag betraktes som høy-ytelses språkteknologi kan nedfelles i svært små apparater.

- En av de store problemene vi møter med det vell av nye apparater som kommer til å skylle over oss, er knyttet til brukergrensesnittet. Et naturlig talt språk er det enkleste grensesnittet å bruke, det eneste som virkelig kvalifiserer til betegnelsen intuitivt brukergrensesnitt.

Bastiaens mener bruken av moderne teknologi vil gjøre store framskritt den dagen komplekse oppgaver, som i dag krever studier av apparatspesifikke håndbøker, kan løses bare ved at du sier høyt hva du vil. Han nevner programmering av telefoner, og talestyrt WAP. Her må ikke "programmering" forstås i klassisk teknologisk forstand. En programmeringsoppgave kan være å instruere WAP-telefonen at når du sier "kjøp en bok" skal telefonen straks bla opp WAP-stedet til bokhandelen Barnes & Noble.

Når noen leser for deg, er det ofte hensiktsmessig at vedkommende ikke ukritisk leser alt som befinner seg for eksempel på en webside, men heller innleder en intelligent dialog med deg. Har du bedt om å få en oversikt over bøker med en bestemt tittel fra en bestemt forfatter, er det nok i første omgang å bli fortalt at det er tre utgaver, og hvordan de skiller seg fra hverandre. For eksempel lydbokutgave, harde og myke permer. Så ber du om å få lest opp detaljene fra den utgaven som virker mest interessant. Menyer, kommandoer og så videre bør man hoppe over.

- Vår løsning for dette heter "Intelligent Content Manager". Det er en teknologi for å prøve å forestille seg hva du er interessert i, og gi deg en forkortet utgave av hva som står på en side.

Løsninger med talestyrt web og WAP krever at slik avansert språkteknologi kjøres på spesialiserte "talende tjenere". Lernout & Hauspies samarbeid med Intel tar sikte på å få slike til markedet innen utgangen av året.

Lernout & Hauspie ser kommende milliardmarkeder for språkteknologi særlig i tre sektorer: Internett-tjenester, helsevesen og telefoni - jamfør den kjente NetCom-tv-reklamen fra Marrakech. Egne døtre er utskilt i disse tre sektorer. En sentral utviklingsavdeling skal fore alle med teknologien de trenger. Selskapet har nære bånd til en av sine eiere, Microsoft, og kjøper jevnlig spesialiserte selskaper i ulike land. Det er inne i Nordisk Språkteknologi på Voss, og har nettopp kjøpt opp tilsvarende små men kompetente selskaper i Irland og Frankrike.

Til toppen