Åpen kildekode-program for leppeavlesing

Intel introduserte tirsdag et program som skal gjøre det mulig for datamaskiner å lese leppebevegelser.

Intels forskningsavdeling har utviklet et system som gjør at datamaskiner kan trenes opp til å oversette fra leppebevegelser til språk. Systemet er basert på en ansiktsgjenkjennelsesalgoritme samt audiovisuell talegjenkjenning (AVSR - Audio-Visual Speech Recognition).

Programvarepakken er blitt publisert som en del av en open kildekodelisens for utviklere som arbeider med å forbedre språkegenskapene til datamaskiner.

    Les også:

Ifølge Intel har et at de største hindrene for datamaskiners stemmegjenkjenning til nå vært den alltid tilstedeværende bakgrunnsstøyen. Men Intel mener at den nye programvaren, som synkroniserer videodata med språkgjenkjenning, vil tillate talegjenkjenning med større presisjon.

AVSR-programvaren er en del av Intel OpenCV Computer Vision Library. Dette er en verktøykasse bestående av mer enn 500 bildeprosesseringsfunksjoner som kan brukes til å lage bildegjenkjenningsprogramvare. Intels mål med denne nye teknologien er å fremme en mer naturlig form for interaktivitet mellom brukere og datamaskiner.

- Gjenkjennelse blant mennesker baseres sjelden på bare én type informasjon. Vi tar avgjørelser basert på kombinasjonen av informasjon fra en rekke kilder, sier Justin Rattner, direktør for Intel Microprosessor Research Labs, i en pressemelding.

Mer informasjon om AVSR og lisensordningene finnes på denne siden.

Til toppen