Sovende data kan lamme et datavarehus

- Det er typisk for store datavarehus at 90 prosent av dataene aldri forespørres. Enorme beløp kan spares ved å flytte sovende data til rimeligere lagringsmedier, sier Bill Inmon, internasjonalt kjent som "datavarehusets far".

Bill Inmon, gründer og daglig leder av Pine Cone Systems, var i Oslo i dag i forbindelse med et seminar organisert av hans norske partner Component Software.

Etter foredraget utdypet han noen av temaene overfor digi.no. Inmon er tidligere kjent for digi.nos lesere, se artikkelen "Datavarehusets far" har noe å si til norske ledere.

- Datavarehus må oppfattes som grunnleggende infrastruktur for tidsriktige anvendelser som ressursforvaltning (ERP eller "enterprise resource planning"), kundehåndtering (CRM eller "customer relations management"), elektronisk handel og beslutningsstøtte (BI eller "business intelligence"). Datavarehus kreves for å få et helhetsperspektiv på kunder, produkter og leverandører. Det integrerer opplysninger du får gjennom atskilte applikasjoner, og tilfører en historisk dimensjon ved å ta vare på informasjon utover de øyeblikksbilder vanlige applikasjoner oftest begrenses til.

Inmon mener at datavarehus er særlig undervurdert når forretninger skal starte med e-handel.

- Vakre skjermbilder er bare en del av en e-forretning. Manglende eller mangelfullt datavarehus betyr at nødvendig infrastruktur ikke er tilstede. Å neglisjere infrastrukturen kan være katastrofalt. Et populært e-handelssted i USA måtte avvise alle nye ordre så tidlig som 10. desember. Ingen ønsker å komme i en situasjon der de må avslutte julesalget to uker før jul, sier han.

Som med all annen infrastruktur, må kostnader veies mot funksjonalitet og ytelse. Å tillempe et datavarehus, betyr at behovet for lagringskapasitet "nærmest eksploderer", sier Inmon.

- Årsaken er at man lagrer svært mange detaljer, og at man ønsker å ta vare på opplysninger som strekker seg bakover i tid, noen måneder, et år eller til og med flere år. Det krever langt større kapasitet enn bare å håndtere selve transaksjonene.

Mye av denne eksplosjonen i behov for lagringskapasitet er uunngåelig. Etter hvert viser det seg at noe data brukes aktivt, mens det meste aldri forespørres.

- I startfasen er det lett å overvurdere det du trenger av historiske opplysninger. Legger du opp til at datavarehuset skal oppbevare to års data, tar det gjerne to år før du oppdager at tre måneder hadde vært tilstrekkelig for å oppdage de mønstrene du er ute etter, poengterer Inmon.

En annen faktor som får lageret til å svulme unødvendig opp, er at man tar vare på for mange detaljer. Man er usikker på hva man egentlig trenger, og tar gjerne alt for hardt i.

- Mengden sovende data vokser langt raskere enn den andelen som brukes aktivt. Når datavarehuset vokser over i terabyte-størrelse, og det ikke er noen aktiv styring av hva man tar vare på, kan man trygt regne med at toppen 10 prosent av dataene er i aktiv bruk.

90 prosent av det man tar vare på, er følgelig helt unødvendig. Inmon mener dette sløseriet må til livs.

- Det er like lite hensiktsmessig å sløse bort 90 prosent av et datavarehus på data man aldri bruker, som å bygge et ti etasjers lager og bare bruke den nederste etasjen, eller kjøpe 1000 lastebiler og konsekvent la være å kjøre 900 av dem.

Problemet løses ved å identifisere hvilke data som sover, og flytte det til langsommere og rimeligere lagringsmedier enn datavarehusets avanserte disker. Inmon nevner løsninger fra StorageTek, der mange terabytes kan lagres på båndkassetter i spesielt tilrettelagte siloer, og der roboter sørger for at en hvilken som helst kassett kan lastes på en spiller innen to sekunder. Slike løsninger krever avanserte styringsprogrammer som holder rede på hvilke kassetter som lagrer hva. Slike er tilgjengelige blant annet fra FileTek.

- Å identifisere sovende data krever et egnet overvåkingsverktøy, spesielt tilrettelagt for det som er typisk for et datavarehus. Vanlige verktøy for å overvåke transaksjoner duger ikke. Pine Cone ble opprettet nettopp for å gi brukerne tilgang til slike verktøy. De overvåker det som skjer fra dag til dag og analyserer hva som brukes og hvem som bruker det. Informasjonen lagres og analyseres automatisk, opplyser Inmon.

Pine Cone har erfaring fra 65 store installasjoner verden over. I noen tilfeller har man kunnet iverksette besparelser som allerede etter ti dager dekker det programvaren koster.

- Det er mulig å nesten helt kvitte seg med sovende data. Overvåkningsverktøyene hos en av våre store kunder, Barclays Bank i Storbritannia, viser at andelen aktivt brukte data ligger tett opp til 100 prosent, påstår Inmon.

Besparelsene kan redusere driftsutgiftene til en brøkdel av de opprinnelige. Inmon nevner at et datavarehus på over 20 terabytes kan kreve opptil femten millioner dollar (120 millioner kroner) de første to årene. Intelligent flytting av sovende data kan redusere de årlige driftskostnadene til et sted mellom 1,5 og 2 millioner dollar (12 til 16 millioner kroner) mener Inmon.
Inmons hjemmeside inneholder mange av hans artikler og andre ressurser, blant annet framgangsmåter for å beregne hvor mye ressurser som må inngå i en datavareløsning.

Til toppen