Lotus' store kunnskapstjener endelig klar

Lotus' intelligente, kjappe og lærenemme digitale bibliotekassistent Discovery Server er endelig klar til lansering. - Den økonomiske gevinsten er åpenbar, forsikrer teknologisjef Chris Crummey.

Kunnskapsforvaltning er et område som er i ferd med å definere det man kan kalle tredje generasjons Lotus Development Corporation - etter det banebrytende regnearket som de fleste i dag har glemt, og gruppevaren Lotus Notes/Domino som er det de fleste i dag forbinder med selskapet. Det første kunnskapsproduktet, portalen K-station, ble offisielt lansert i desember. En langt viktigere del, Discovery Server, lanseres offisielt i disse dager. Det er derfor Christopher Crummey, teknologisjef for Lotus' kunnskapsprodukter er kommet til Norge.

Discovery Server er programvare for å hjelpe folk å finne fram til kunnskap fordelt på dokumenter og menneskelig ekspertise. I bruk er den som en kjapp, lærenem og intelligent assistent som vet hvem som vet hva, og hvilke dokumenter som er de beste å lese om alle tenkelige emner. Programvaren har tre hovedfunksjoner: hjelpe til med å opprette et hensiktsmessig klassifikasjonssystem, hjelpe til med å vedlikeholde det, og hjelpe til med å søke i det. Klassifikasjonssystemet gjelder både dokumenter og mennesker.

Første skritt er altså å opprette et klassifikasjonssystem, i praksis en serie med stikkord som assosieres med dokumenter.

- Det starter med at du finner fram til en datamengde som du mener best gjenspeiler den kunnskapen du vil temme, sier Crummey. - Discovery Server analyserer dokumentene, og foreslår en hierarkisk struktur der hver "katalog" er utstyrt med et navn som programvaren selv foreslår. Du kan innstille programmet til å velge ulike grader mellom flat struktur, og strengt hierarkisk struktur, og i hvilken utstrekning du vil la dokumenter klassifiseres under flere henvisninger.

Algoritmene for å generere denne "taksonomien" har sysselsatt en vesentlig del av ressursene til IBMs programvareforskere de siste årene. Alle dokumentformater gjennomgås.

- Det som genereres, må betraktes som et utkast. Treningsmengden bør være representativ, og ha en viss størrelse. Utkastet må redigeres. Vår erfaring er at både katalognavn og katalogstruktur ofte krever justeringer. På den andre siden erfarer vi og prøvekundene at systemet foreslår uventede ting som viser seg å være svært hensiktsmessig.

Algoritmene for å generere denne "taksonomien" har sysselsatt en vesentlig del av ressursene til IBMs programvareforskere de siste årene. Alle dokumentformater gjennomgås.

- Det som genereres, må betraktes som et utkast. Treningsmengden bør være representativ, og ha en viss størrelse. Utkastet må redigeres. Vår erfaring er at både katalognavn og katalogstruktur ofte krever justeringer. På den andre siden erfarer vi og prøvekundene at systemet foreslår uventede ting som viser seg å være svært hensiktsmessig.

Katalogstrukturen er en logisk struktur. Den har ikke sammenheng med hvordan filer lagres på disk, selv om dokumentene kan presenteres etter den kjente mappemetaforen. Et dokument kan gjerne presenteres i flere "mapper". Det er spesielt viktig der man har foretrukket en flat struktur på klassifiseringen.

- Discovery Server "lærer" av de manuelle rettelsene og justeringene, og nytter dem når nye dokumenter legges inn i systemet. Etter hvert får du en kontinuerlig prosess der alle nye dokumenter automatisk klassifiseres etter det korrigerte systemet, og nye justeringer automatisk gis tilbakevirkende kraft. Erfaringen er at en bibliotekar får mer ut av Discovery Server enn av titalls personlige hjelpere.

Mot brukerne tilbyr Discovery Server et grensesnitt for søk og rapportering. Søk kan forfines trinnvis mot en stadig mer avgrenset søkemengde. Treff sorteres etter et tall som skal gjenspeile hvor relevant dokumentet er i forhold til søket. Opplysninger som vises, kan avgrenses til tittel, eller utvides til innledende avsnitt, kort oppsummering, stikkordliste, forfatter, dato og så videre.

Klassifisering av personer foregår på grunnlag av dokumentene som de produserer. Det er alltid overlatt til den enkelte å redigere de opplysningene som systemet genererer automatisk, og som skal gjøres tilgjengelig for andre. Også her poengterer Crummey hvor viktig det er at oppdateringen foregår automatisk, og at alle gjøres kontinuerlig oppmerksomme på de profiljusteringene som Discovery Server foreslår for dem.

- Å finne ut hvem du kan spørre om noe, er ofte vel så viktig som å finne ut hvor du kan lese om noe. Discovery Server kan brukes uavhengig av annen kunnskapsvare fra Lotus. Bruker du det sammen med for eksempel K-station, vil du ha ytterligere verktøy for å lokalisere de ekspertene Discovery Server finner for deg.

Erfaringsmessig ligger mye kunnskap i bedriftens e-post. Discovery Server kan holde rede på e-post i både Microsoft Exchange og Lotus Notes. Den kan også koples mot LDAP-kataloger.

De fremste målgruppene for Lotus' kunnskapsteknologi er teknologipregede forskningsmiljøer, gjerne USAs militære, og andre store dokumentgenererende miljøer i offentlig og privat virksomhet.

- Effektivitet i slike miljøer er gjerne avhengig av at man følger med i hva hele organisasjonen driver med, slik at man ikke kommer i situasjoner der grupper arbeider med det samme uten å vite om hverandre.

Kunnskapsteknologi kan også betraktes som et storslagent verktøy for tematisk analyse i for eksempel humanistisk forskning. For Crummey er dette imidlertid en ny tanke, som han lover å tygge videre på.

Til toppen