Microsoft taleserver foreløpig bare for USA

På Microsofts stort anlagte utviklerkonferanse i mars, vil den nye Speech Server få stor oppmerksomhet.

På Microsofts stort anlagte utviklerkonferanse i mars, vil den nye Speech Server få stor oppmerksomhet.

Den kommende taleserveren til Microsoft, Speech Server (MSS), har i flere uker vært tilgjengelig som beta for en begrenset gruppe amerikanske utviklere. Den vil lanseres formelt på den stort anlagte utviklerkonferansen VSLive! 2004 i San Francisco 24. mars. Etter forhåndsomtalen å dømme vil Bill Gates bruke en stor del av sin åpningstale på Speech Server.

For Norge og andre europeiske land vil lanseringen ikke ha noen umiddelbar betydning, får digi.no opplyst fra Microsoft. Årsaken er at Speech Server inntil videre bare håndterer "US English". Analyseselskapet Gartner sier de ikke har fått tilbakemeldinger fra de 500 selskapene som har deltatt i uttestingen. Det kan tyde på at Microsoft vil høste flere erfaringer før man legger produktet til rette for andre språk og dialekter.

Hensikten med Speech Server er å forenkle, og følgelig også gjøre rimeligere, tilretteleggingen av talestyrte applikasjoner på Windows-plattformen. Den grunnleggende ideen for dette, er at man ringer fra en vanlig telefon, og koples til en webserver som retter seg etter det du sier. For sikkerhets skyld er Speech Server også i stand til å håndtere ikke-talestyrt grensesnitt, det vil si av typen der du taster "1" for ditt, "2" for datt, og så videre.

Speech Server er tilrettelagt slik at det kan fungere sammen med motorer for henholdsvis kunstig tale og talegjenkjenning fra Microsoft og fra andre leverandører. Det er en dyd av nødvendighet i den tidlige tilstanden taleteknologi befinner seg i dag. Under testingen har man holdt seg til talegeneratoren Speechworks Speechify (Speechworks ble i fjor høst kjøpt av ScanSoft, taleteknologiselskapet som i november 2001 plukket opp restene etter Lernout & Hauspie) og til Microsofts egen talegjenkjenning ("Microsoft Speech Recognition Engine").

Speech Server bygger på protokollen Speech Application Language Tags (SALT) for talegrensesnitt mot webapplikasjoner. Den har ingen formell godkjenning som standard, selv om den støttes av blant andre Cisco, Intel, Microsoft og Philips. Disse selskapene gikk sammen om SALT Forum i oktober 2001 for å fremme protokollen.

SALT er delvis en konkurrent til W3C-standarden VoiceXML som i mars 2000 fikk sitt eget forum, VoiceXML Forum. VoiceXML er et markeringsspråk som gjør at applikasjoner med talegrensesnitt kan formidles over nettverk basert på Internett-teknologi. Støtten til disse er dels overlappende – Cisco og Intel er med i begge fora – dels konkurrerende – Microsoft er bare med i SALT, mens Sun, IBM og Oracle støtter VoiceXML. Det er mulig at de to vil smelte sammen, men fortsatt usikkert.

Gartner har offentliggjort flere vurderinger av Speech Server, senest for et par dager siden. Analyseselskapet slår fast at Microsofts inntreden på markedet for taleteknologi vil endre konkurransevilkårene, at Microsoft-teknologien ennå ikke har vist hva det duger til, og at bedrifter som er sterkt opptatt av .Net bør se nærmere på det nye serverproduktet.

Lenkene nedenfor gir bakgrunnsinformasjon om praktisk bruk av talegjenkjenning i Norge.

    Les også:

Til toppen