Fast klarer åsøke i lyd og video

Fast er snart klar med teknikk for å søke i video. Teknikken forstår norsk og vil kunne skille menn fra kvinner.

digi.no omtalte flere selskaper som arbeider med teknologi for å søke i video eller bilder. Analyseselskapet Gartner mener at teknologien ikke er moden, men blir stadig bedre.

Teknologien fra selskaper Evision og pixlogic fokuserer på å finne like bilder, men det er ofte ikke så nyttig, påpeker teknologisjef i norske Fast, Bjørn Olstad.

- Du må da først finne et bilde av en tiger og så be et søkesystem om å finne flere eller lignende bilder. Dette etterspør ikke markedet, man må heller skape løsninger mer målrettede løsninger, for eksempel på nettbutikker for å finne lignende produkter, mener Olstad.

Olstad mener at det er først når søkesystemet også analyser lyd og tekst man kan skape nyttigere løsninger. Og dette leverer Fast.

Fast har i mange år hatt teknologi for bildesøk. Hittil har ikke teknikken vært noen kommersiell suksess, men nå er det i ferd med å løsne, forteller Olstad.

For med den nye 5.0-versjonen av Fasts søkemotor har Fast satt sammen en mer komplett løsning.

Med Fast-pakken klarer Fast å søke i video og lyd på en rekke forskjellige løsninger. I løpet av et par måneder vil løsningen kunne forstå norsk, forteller Olstad.

Slik klarer Fast-løsningen å søke i video og lyd:

Fast har kjøpt inn lydtolke-programvare fra andre aktører og koblet den til sin søkeløsning. Ved å analyse lyden får man ut en tekstfil som man har koblet til tidsaksjen i videoen.

I tillegg klarer Fast å gå igjennom videoen og finne tekst som er blitt filmet, for eksempel reklameskilt eller bildskilt.

Fast har kjøpt inn systemet som gjør lyd-til-tekst-oversettelsen, men Fast jobber selv med å analysere lyden på mer avanserte måter. Fasts teknikk klarer å skille menn fra kvinner og finne folk som er opphisset. Fast klarer også å finne scene-skifter, musikk og gjenkjenne stemmen til en person fra en videofil til en annen. Når man først har fått identifisert denne personen og lært opp systemet, kan man så søke med navn.

Dermed kan brukere av Fast-systemet søke og ikke bare få et treff på en videofil, men også få vite hvor i videofilen søketreffet oppstår og kunne hoppe direkte dit.

- Det er stor interesse for dette akkurat nå. Vi arbeider med seks kunder som alle vurderer prosjekter med søk i video og lyd, forteller Olstad, men vil ikke oppgi konkrete kundenavn.

Teknikken kan også finne lyd som ligner på hverandre, noe som potensielt kunne brukes til å finne musikk eller stemmer som ligner på hverandre.

Olstad indikerer at video og lydsøk ikke vil dukke opp offentlige søkemotorer som Sesam eller Google. Det finnes en rekke bruksområder. En ting er aktører som NRK som skal gjøre sitt arkiv søkbart.

- Teknikken er interessant for bedrifter som ønsker å sjekke hvorfor kundene deres ringer til brukerstøtte eller analysere svarene, påpeker Olstad. Man kan også for eksempel filme kundeintervjuer og gjennom analyse av ordbruk kartlegge deres holdninger til et produkt.

Olstad påpeker at Fast har teknikk kan gjøre avanserte bildeanalyser på farger, tekstur og form. Dette åpner for å finne like bilder, men datamaskiner klarer fremdeles ikke å forstå at et hus er et hus. Systemet kan først og fremst brukes til å finne like bilder.

- Bildesøk har hittil primært vært brukt til å overvåkning – å lete etter uønskede bilder som barneporno eller porno, for eksempel internt i en bedrift, påpeker Olstad.

Til toppen