Bare tre prosent analyseres

«Big Data» går til spille, sier rapport.

Bare tre prosent analyseres
Verdens samlede digitale datamengde vil nå 40 zettabyte i 2020, ifølge IDC. Bare en brøkdel vil være «Big Data». Og bare en brøkdel av «Big Data» vil faktisk analyseres. Bilde:

Analyseselskapet IDC har utgitt en ny rapport om «Big Data» og det «digitale universet», sponset av lagringsgiganten EMC: IDC Digital Universe Study, «Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East».

For IDC er det «digitale univers» den totale mengden av digitalt lagret data, innhold og informasjon. Universet anslås til 2,8 zettabyte i dag. Det svarer ganske bra til IDCs spådom på 2,7 zettabyte fra desember i fjor. Det er en vekst på 48 prosent fra 2011.

IDC tror universet vil vokse til 40 zettabyte innen 2020. Det svarer til en gjennomsnittlig årlig vekstrate på rundt 40 prosent. Vekstfaktorer er alt fra økt utbredelse av pc-er og smartmobiler, økt bruk av digitale bilder og video, til dataeksplosjon fra stadig flere overvåkningskameraer og digitale sensorer.

En zettabyte er 1000 exabyte, det vil si en million petabyte eller en milliard terabyte. IDC prøver å anskueliggjøre 40 zettabyte ved å regne ut at det utgjør en mengde byte tilsvarende 57 ganger mengden av sandkorn på jorda.

Skal man lagre 40 zettabyte på Blu-ray-disker, ville diskene til sammen veie like mye som 424 Nimitz-klasse hangarskip. Et slikt hangarskip veier rundt 100 000 tonn.

FN anslår verdens befolkning til 7,7 milliarder i 2020. 40 zettabyte vil da svare til 5,2 terabyte per person.

Maskingenererte data utgjorde 11 prosent av det digitale universet i 2005. I 2020 tror IDC andelen vil øke til 40 prosent.

Ikke alt i det digitale universet kvalifiserer til betegnelsen «big data». Ifølge IDC kunne 23 prosent av de 2,8 zettabyte være til nytte, det vil si 643 exabyte. Av disse er det bare 3 prosent som faktisk kommer til nytte ved å brukes i en eller annen tagging eller analyse.

Andelen «nyttige» data vil ifølge IDC øke til 33 prosent – 13 zettabyte – i 2020. De tør ikke anslå hvor mye som faktisk vil utnyttes.

En kilde til bekymring er at store deler av det digitale universet er ubeskyttet.

Ikke alt krever beskyttelse, men IDC venter at andelen med beskyttelsesbehov vil vokse raskere enn selve universet. Andelen var 33 prosent i 2010, og ventes å øke til 40 prosent innen 2020.

Ikke alt som krever beskyttelse får det. I 2012 er andelen data som krever beskyttelse 35 prosent, mens andelen som får det, er 20 prosent.

Den geografiske fordelingen av det digitale universet vil endres kolossalt fram til 2020.

Vekstmarkedenes andel var 23 prosent i 2010 og har vokst til 36 prosent i 2012. Prognosen for 202 tyder på en andel på 62 prosent i 2020.

I dag står USA for 32 prosent av det digitale universet, mot 19 prosent for Europa, 13 prosent for Kina og 4 prosent for India. I 2020 ventes Kina alene å stå for 22 prosent av det digitale universet, ifølge IDC.

Les mer om: