Talegjenkjenning

Googles talegjenkjenning kan bli uavhengig av nettilgang

Nyutviklet system krever bare 20 megabyte med minne på mobilen.

Googles talegjenkjenning kan bli uavhengig av nettilgang
(Bilde: Android Open Source Project. Montasje:digi.no )

Nyutviklet system krever bare 20 megabyte med minne på mobilen.

De fleste av Googles tjenester som tar i bruk kunstig intelligens og maskinlæring, er avhengige av nettilgang fordi selve prosesseringen gjøres på selskapets servere. Det er trolig flere årsaker til dette, men en viktig årsak er at løsningene er for ressurskrevende til å kunne kjøres på for eksempel en smartmobil.

Men det er også flere ulemper med dette. Det ene er at man er avhengige av å ha nettilgang for å kunne bruke tjenestene. En annen ulempe er at man kanskje må dele mer med Google enn det man egentlig ønsker.

Dette gjelder også avansert talegjenkjenning, hvor mer enn bare et begrenset utvalg av faste kommandoer skal støttes.

Lettvekt

Men nå har forskere ved Google utviklet et system for personlig talegjenkjenning for mobile enheter som krever ikke nettilgang. Det er ZDNet som først har omtalt dette systemet.

På en 2,5 år gammel Nexus 5-mobil kjøres programvaren med en median hastighet som er sju ganger høyere enn sanntid. Systemet beskrives som et kompakt talegjenkjenningssystem med støtte for et stort vokabular. Minnebruken skal være begrenset til 20,3 megabyte, omtrent 1 prosent av den totale minnemengden til Nexus 5.

Det ulike teknikkene som har blitt tatt i bruk for å oppnå den beskjedne minnebruken, er omtalt i dette dokumentet.

Systemet kan nå håndtere en kommando som denne:

«Send an email message to Darnica Cumberland: can we reschedule?»

En utfordring er navnet som er oppgitt i kommandoen. Dette løses ved integrere personlig informasjon på enheten, for eksempel kontaktlisten, med språkmodellen.

Forskerne oppgir at systemet deres har en feilrate på ordnivå på 13,5 prosent i forbindelse med dikteringsoppgaver.

Systemet skal presenteres under IEEE-konferansen International Conference on Acoustics, Speech and Signal Processing som arrangeres i Shanghai i nesten uke. Det er ikke kjent når teknologien eventuelt vil gjøres tilgjengelig i tjenester som Google Now.

Til toppen