Gjennombrudd for talestyring

Talestyring er ikke lenger bare en kuriositet som kun egner seg som publikumsmangnet på datamesser. Teknologiske gjennombrudd har nå gjort det mulig for systemer å filtrere ut støy og tillater ulike brukere å snakke med naturlig hastighet, rapporterer Norges Industriattachéers Jørgen Andre Nilsen fra Silicon Valley.

Finansindustrien og flyselskaper er blant de første og største brukere i USA av slik talestyring.

Talestyring har i mange år lovet å forbedre grensesnittet mellom menneske og maskin, men kommersielt har talestyringssystemer stort sett kun mestret tolking av enkle, stikkordsmessige kommandoer som gis til et tekstbehandlingssystem eller et operativsystem.

Teknologien er nå kraftig forbedret og i dag kan de kraftigste systemene oversette kontinuerlig tale (ikke bare nøkkelord med en nøyaktighet på 95 prosent) og ofte uten noen som helst form for opplæring av systemet på forhånd.

De to industriene som har vært flittigst i å ta i bruk slike systemer er reiselivsindustrien og finansindustrien, bransjer hvor en svært stor del av kundebehandlingen nå skjer via telefon. American Airlines har nettopp tatt bruk et bestillingssystem som gjør at kunder kan ringe og gjøre sine reservasjoner av flybilletter direkte mot bookingsystemet uten å måtte gå veien om en tungvint flervalgsmeny med endeløse kommandokjeder av stjerne- og firkanttegn. Hvis noe er uklart, stiller maskinen spørsmål tilbake akkurat som man skulle snakke med et menneske.

Meglerhus som Charles Schwab og E-trade har lenge hatt systemer hvor kunder via talestyring kan legge inn kjøps- og salgsordre. Swiss American har gått et skritt lenger. Halvparten av selskapets 30 meglere bruker i dag et talegjenkjenningssystem fra Voice Horizon for å utføre aksjehandel over telefon.

Den virkelig ildprøven for talegjenkjenningssystemer vil imidlertid bli gjennomført i regi av selskapet Salomon og Smith Barney. Meglerhuset installerer i disse dager et system som skal kunne gjenkjenne stemmene til sine meglere på handelsgulvet på New York børsen - NYSE. Her kan støynivået ofte komme opp i 100 decibel. Hvis en kjøps- eller salgsordre kan formidles direkte til maskinen i stedet for gjennom dagens manuelle system, vil dette kutte tiden det tar å plassere en ordre fra 15 til 5 sekunder ifølge leder for "NYSE-floor"-operasjonen til Salomon Smith Barney. De 10

sekundene kan på dager med store svingninger bety mange millioner i ekstra fortjeneste eller unngåtte tap.

Ifølge analyseselskapet TMA Associates vil markedet for talegjenkjenningssystemer vokse fra knappe 317 milloner dollar i 1998 til nærmere 8 milliarder dollar i år 2001. Kapitalen flyter også friskt til de store leverandørene på området - Nuance Communications, Applied Language Technologies og Lernout & Hauspie Speech Products NV hvor Microsoft har en betydelig aksjepost.

Til toppen