Opera tror på talestyrt videoopptaker

En kombinasjon av tale og menyer vil gjøre det lettere å styre videoopptakere, mener Opera.

I mars i fjor ble det kjent at Opera Software samarbeidet med IBM for å integrere taleteknologi i sine produkter. Betautgaven av den neste versjonen av nettleseren for Windows er klargjort for talestyring, og for kunstig tale slik at man kan få lest opp dokumenter og e-postmeldinger. Den skal også være forberedt for nettsteder som vil tilby interaktive talebaserte systemer for e-handel.

    Les også:

I dag kunngjør Opera et produkt som de beskriver som en talende elektronisk programguide for hjemmemedier. Poenget her er å kunne talestyre DVD-spillere, tv-er, videoopptakere og lignende, i stedet for å forholde seg til fjernekontrollenes anstrengte brukergrensesnitt.

– Det dreier seg ennå ikke om et ferdig forbrukerprodukt, presiserer PR-spesialist Berit Hanson hos Opera. – Vi tilbyr noe som OEM-ere kan legge inn i sine løsninger. Vi håper forbrukere vil kunne erfare dette enklere talestyrte grensesnittet om ikke lenge.

I likhet med den talestyrte nettleseren, vil Operas talestyrte programguide inntil videre bare være tilgjengelig på engelsk. Årsaken er at Opera bygger på grunnleggende taleteknologi fra IBM, og at denne ennå ikke er tilrettelagt for norsk.

– Erfaringene våre er at den virker godt på alle former for engelsk, både britisk og amerikansk, og med utenlandske aksenter, for eksempel norsk, sier Hanson.

Prinsippet for Operas befatning med taleteknologi er at tale supplerer det visuelle brukergrensesnittet. For nettleseren og den talestyrte programguiden anvendes en industristandard kjent som XHTML+Voice, forkortet X+V, en kombinasjon av XHTML og VoiceXML. De som står bak X+V er IBM, Motorola og Opera. De gikk sammen om å fremme X+V overfor W3C som standard for flermodus markeringsspråk for webapplikasjoner som kombinerer talende og visuelle grensesnitt.

Målgruppen for den talestyrte programguiden er bedrifter og utviklere. Opera har bygget IBMs ViaVoice-teknologien inn i sitt webbaserte presentasjonsmiljø, slik at det kan tilby en plattform for talestyrte interaktive tjenester til alt fra programguide og video på forespørsel til nettleser.

I Operas utviklerpakke for talestyrte tjenester inngår IBM WebSphere Multimodal Toolkit der blant annet Embedded ViaVoice er integrert.

– Den endelige versjonen av vår første talestyrte nettleser vil være klar om noen uker, sier Hanson. – Målgruppen er dem som ønsker å kombinere et talestyrt grensesnitt med skjermopplesing i begrenset grad. Vi anbefaler den ikke spesielt som hjelpemiddel for blinde.

IBM og Microsoft har i årevis propagandert talestyrte grensesnitt som framtiden for interaktive tjenester.

– Vi er overbevist om potensialet på dette feltet. Demonstrasjonen vår viser hvor enkelt det er å talestyre en videoopptaker. Dette vil slå gjennom, en gang.

På nettet kan man kjøre IBM-applikasjoner med kombinerte grensesnitt. Her gis blant annet denne illustrasjonen av hva X+V går ut på, og hvordan det forholder seg til ren talestyring (VoiceXML) og rene visuelle grensesnitt (XHTML):

Til toppen