Verden lager mer data enn vi kan lagre

Gapet mellom lagringskapasitet og dataproduksjon blir stadig større, sier IDC.

På oppdrag fra lagringsspesialisten EMC har analyseselskapet IDC laget en rapport, The Digital Universe Decade, der de prøver å danne seg et bilde av hvordan verdens samlede produksjon og håndtering av digitale data vil fortone seg i årene fram til 2020.

Ikke uventet, spår IDC at mengden produserte digitale data vil øke til uante nivåer. Det samme vil lagringskapasiteten.

Utfordringen, ifølge IDC, ligger i at produksjonen vil langt overstige lagringskapasiteten.

Tilsynelatende vil ikke den manglende lagringskapasiteten legge en demper på produksjonen. Det betyr at hva man lagrer – og hvordan – og hva man kaster, er problemstillinger alle må ha et bevisst forhold, både forbrukere, bedrifter og det offentlige.

Det økende gapet mellom produksjon og lagringskapasitet illustreres i denne grafen:

Problemet er ikke spesielt akutt i dag. Men det blir det etter hvert som stadig flere medier digitaliseres, og stadig flere filer utveksles og kopieres.

I 2020 vil det produseres 35 millioner petabyte med digitale data. Det er 44 ganger de 800 000 petabyte som ble generert i 2009. (En petabyte er i overkant av en million gigabyte.)

Skulle man stable oppå hverandre dvd-er med en samlet kapasitet på 800 000 petabyte, ville stabelen rukket fram og tilbake til månen. Det tilsvarende bildet for de 35 millioner petabyte verden lager i 2020, er halvveis til Mars.

Underskuddet av lagringskapasitet er et fenomen IDC mener har vært et faktum siden 2007.

I 2009 var den tilgjengelige lagringskapasiteten rundt 520 000 petabyte, det vil si 280 000 petabyte mindre enn produksjonen. Skulle alt blitt lagret, måtte kapasiteten økes med over 50 prosent.

I 2020 har produksjonen tatt 44-gangeren, mens lagringskapasiteten bare har tatt 29-gangeren, ifølge IDC. Det produseres 35 millioner petabyte, hvorav bare 15 millioner kan lagres. For å være på høyde med produksjonen, burde lagringskapasiteten vært mer enn det dobbelte.

Trøsten er at mye av dataproduksjonen dreier seg om kopiering.

Vanlige gjøremål som surfing, e-post, videotjenester med mer genererer store mengder kopier som bare trenger midlertidig oppbevaring.

Ifølge IDC består 75 prosent av all data av kopier. Bare 25 prosent er unik. Flere faktorer medvirker til at mye kopieres, som offentlige regler for oppbevaring av data og måten mange applikasjoner fungerer på. Likevel mener IDC at det oppbevares alt for mange overflødige kopier, og at deduplisering vil bli en nøkkel til å redusere lagringskostnader og sikre kapasitet til å ta vare på det som virkelig er nødvendig.

Den globale utfordringen ved å mestre den voldsomme veksten i mengden produserte data kan også illustreres ved å sammenlikne veksten i antall filer, med veksten i antall IT-folk.

Mens datamengden øker 44 ganger, øker antall filer 67 ganger, ifølge IDC. Men i 2020 vil det bare være 40 prosent flere IT-folk verden over enn i 2009.

IDC-rapporten er innom en rekke problemstillinger rundt kostnader, utvalg av data til lagring, sikkerhet og så videre. En interessant observasjon som gjelder personvernet, gjelder ulike kilder til digitalt lagret informasjon om hver av oss.

– IDC har oppdaget at gigabytene som genereres gjennom handlinger en selv person utfører direkte, som fotografering, blogging, e-post, nedlasting av musikk og bruk av minibank, er mindre enn 10 prosent av den samlede informasjonen om vedkommende i hele det digitale universet. De øvrige 90 prosent består av spor etter transaksjoner, overvåkingsbilder, analytisk materiale om surfing og bruk av web og så videre, står det i rapporten.

Konklusjonene i rapporten er relativt nøkterne, i forhold til de oppsiktsvekkende spådommene.

IDC anbefaler at det utvikles bedre verktøy for flere formål, som søk og automatisk å legge en form for struktur inn i ustrukturerte data, styring og prioritering av lagringsbehov, og for sikkerhet og personvern. De anbefaler videre at man gjør seg klar for å ta i bruk tjenester i nettskyen, og at bedrifter etablerer kjøreregler for bruk av sosiale nettjenester, praktisering av IT-sikkerhet og prioritering av informasjon.

Til toppen