IBM klar med neste generasjons søkemotor

IBM har utviklet en teknikk som kan tolke innholdet av nettsider og lanserer nå den første tjenesten.

For to år siden ble det kjent at IBM arbeidet med et omfattende utviklingsprosjekt på søketeknologi ved sitt forskningssenter i Almaden i Silicon Valley. digi.no tok den gangen kontakt med IBM, men fikk beskjed om å vente - i hvilken form teknologien ville lansere var ikke klart.

Nå viser det seg at IBM er ferdig med en ny teknologi som trolig kan brukes til ganske mange typer søkeoppgaver - også trolig generelle søkemotorer som Google.

Teknologien, som kalles WebFountain, går et skritt videre enn dagens søketeknologi. For dagens søkemotorer teller i utgangspunktet bare ord og lenker, om enn på en avansert måte. Ingen av dagens søkemotorer forstår ordene på nettsidene de leser.

Dette gjør WebFountain. IBM har trolig brukt en del av teknologien selskapet har utviklet på stemmegjenkjenning og språktolkning. WebFountain analyserer teksten for og kan dermed rangerer sider etter mening, blant annet ut i fra forekomsten av adjektiver med forskjellig vekt og betydning.

IBM påpeker det ikke eksplisitt, men trolig fungerer derfor teknologien i første runde på engelsk tekst. IBM har åpenbart klart å øke hastigheten på denne tekstanalysen til et nivå der man kan samle inn og analysere store antall Internett-sider i sanntid.

Til sammen gir dette helt nye mulighet for søk, men IBM går etter de beste betalte tjenestene først, og det er ikke gratis internett-søk.

WebFountain skal først brukes i noe som kan kalles et verktøy for "omdømme"-analyse. I stedet for å samle inn avisklipp og analysere disse manualt, har Factiva, et selskapet eid av Dow Jones/Reuters lisensisert WebFountain-teknologien. Factiva skal la WebFountain analysere alle artiklere fra flere tusen nyhetskilder og tilby bedrifter overvåkning av sitt omdømme og presseomtale i sanntid.

Nivået for å kjøpe WebFountian-tjenester er også gjort lav ved at det er en helt outsourcet tjeneste. Både sluttkundene og selskaper som Facitiva slipper å kjøpe og drifte den selv - det gjør IBM.

Det er IBM som både samler inn og analyserer sidene. I Factivas tilfeller har selskapet åpnet sine arkiver og systemer slik at IBM får kopiert alt. Tjenesten kan også kopiere og analyserer alt som skjer på chat-grupper, weblogs og diskusjonsfora.

- Med WebFountain vil våre kunder nå bruke de enorme informasjonsmengdene på Internett som et forretningsverktøy, sier WebFountain-sjef Robert Carlson i pressemeldingen.

Olje/gass-selskapet BP har i lengre tid testet tjeneste for å overvåke sitt totalomdømme.

IBM understreker at Factiva bare er den første leverandøreren som utnytter WebFountain. IT-giganten inviterer nå alle som vil til å skape tjenester som analyserer nettinnhold. Slike tjenester vil kunne analysere både internett-innhold og dokumenter/nettsider internt i en bedrift.

I sin pressemelding påpeker IBM at WebFountain kan følge med på og analysere både strukturerte data (databaser) og ustrukturerte data (dokumenter). Dermed kan WebFountain bli en ny konkurrent til alle selskaper som selger interne søkemotorer, blant annet norske Fast Search & Transfer.

Det store spørsmålet er om og når noen eller IBM selv lanserer en generell Google-konkurrent.

Her kan du lese mer om WebFountain på IBMs hjemmesider.

Til toppen