EMC lanserer søk med Fast-motor

EMCs spesialiserte arkivboks Centera utvides med søkemotor levert av norske Fast.

EMC er mest kjent for sine spesialiserte lagringssystemer Clariion (i den nedre enden av prisintervallet) og Symmetrix (i den øvre enden). I 2002 lanserte EMC det elektroniske arkivskapet Centera, som, spesielt etter en fornyelse for et år siden, spiller en stadig større rolle i selskapet.

Centera erstatter lagring til bånd og optiske medier, gjør sikkerhetskopiering overflødig, og gir samtidig rask tilgang til dokumenter, bilder, e-post og så videre. Løsningen tilfredsstiller i dag USAs strenge juridiske krav til at materiale som hentes ut av systemet, ikke er endret siden det ble lagt inn. Det elektroniske arkivet har grensesnitt mot flere fil- og serversystemer, fra Windows til stormaskin.

Systemet er modulært og selges i bunter på åtte «noder» – ser ut som flate servere i et rack – om gangen. Hver node har en brutto lagringskapasitet på fire ganger 320 GB, slik at åtte noder rommer rundt 10 terabyte. Ett kabinett kan samle 32 noder (40 terabyte), åtte kabinetter kan samles i en klynge (320 terabyte) og det er Centera-installasjoner der åtte samkjørte klynger. Større enn det har ingen hatt behov for ennå.

Arkitekturen er slik at man utfyller med nye noder etter behov, og det spiller ingen rolle om de nye nodene har mer moderne disker og andre komponenter enn dem man startet med. Arkivet skal være fullt ut selvdriftende og selvkonfigurerende.

EMC betegner denne typen arkivskap for «Content Addressed Storage». Det som lagres, er filer – objekter – med innhold. Arkivet luker ut alle duplikater. Brukt som e-postarkiv, innebærer dette at om et vedlegg tilhører hundre e-postmeldinger, lagres selve vedlegget bare én gang.

Ønsker man katastrofeberedskap, kan et Centera-arkiv settes til å speile et annet, eller man kan ha to arkiv som fores med de samme objektene, uavhengig av hverandre.

Centera har sitt eget spesialiserte operativsystem. Når et objekt lagres, inngår metadata om objektet i en egen database. Databasen kan lagres i Centera-arkivet, eller på egne servere i forkant. Metadataene genereres av applikasjonen som objektene opprettes i. De peker på en 256 biters nøkkel som er unik for hvert objekt, og som gjør at Centera kan gjenfinne objektet.

Den praktiske bruken av arkivløsningen avhenger i høyeste grad av metadataene. Det er bakgrunnen for at EMC har alliert seg med uavhengige leverandører for å få funksjonelle løsninger for ulike behov, for e-postarkiv, talearkiv, innholdsforvaltning med mer. Det finnes over 170 slike løsninger, ifølge EMC.

Integrasjonen av søketeknologi fra norske Fast i Centera, som ble kunngjort i går, bygger på EMC og Fasts felles erkjennelse av at søk er en egenskap som bør bygges inn i en arkivløsning på et så grunnleggende nivå som mulig.

Løsningen tilretter Fast ESP («enterprise search platform») for Centera, og er døpt «Centera Seek».

– Fast vil gjøre søk til en del av infrastrukturen. Forretningskritiske applikasjoner krever søk. Søk skal være et tjenestelag, ikke en applikasjon. Med Centera Seek blir arkivløsningen langt på veg en selvstendig løsning for alle former for arkivering av dataintensive tjenester, med innebygget skalering og feiltoleranse. Det gir et bedre grunnlag for EMC å gå til kunden. Det er lettere å komme med et funksjonelt budskap enn å selge gigabyte og gjenfinningstid, sier Bjørn Olstad som leder utviklingsarbeidet i Fast.

Med Centera Seek foregår søkene i metadataene, ikke i selve dokumentet. Ekstrahering av metadata fra et objekt kan langt på vei automatiseres. Et eget programmeringsgrensesnitt gjør det for eksempel mulig å lage løsninger for automatisk å trekke ut, ved arkivering, referanser til personer, selskaper, steder og annet relevant innhold. Et annet programmeringsgrensesnitt på søksiden gjør det mulig å legge opp standardiserte søk for å finne igjen informasjon, genererer rapporter eller automatisere komplekse operasjoner. Olstad nevner blant annet automatisk sletting av objekter som er eldre enn en bestemt grenseverdi.

Partene mener Centera Seek vil gjøre arkivløsningen svært tiltrekkende for store bedrifter, siden lagre mange ganger større enn Google kan håndteres med gjenfinningstider godt under sekundet for spesifikke dokumenter. De ser også for seg et nytt forretningsområde for arkivering, der mindre bedrifter kan leie arkivplass og oppleve arkivet like raskt som filsystemet på en lokal server – og mange ganger så sikkert.

    Les også:

Til toppen