ETTERLYSER DEBATT OG RETNINGSLINJER: Utfordringene med big data er mange og inkluderer datafangst, behandling, lagring, søk, deling, analyse og visualisering med mer, skriver artikkelforfatteren.

Big data krever retningslinjer

KOMMENTAR: Overflod av data ingen garanti mot feil og misbruk, mener Friprogsenteret.

KOMMENTAR: Mange prater om den store nye æraen og det som skal bli det nye løftet i global IT-næring, andre tror det er en «hype». Det vi kan si er at det er et marked i stor endring og vekst.

Vi vil ha mer fokus på hva som må til for at alle skal ha tillit til å dele sine data og følgelig stole på resultatene fra big data.

Big data, som de fleste innovasjoner, er et tveegget sverd som kan gi oss en rekke fordeler. Det gjør det mulig å tilpasse produkter og tjenester i en massiv skala, det gir grunnlag for nye tjenester og nye forretningsmodeller, og kan bidra til å redusere risiko og se løsninger på en ny måte. Samtidig, kan ledere/forskere/databehandlerer med dårlige hensikter eller feil kompetanse skade personer, samfunn og/eller institusjoner når analysen ikke blir helt riktig av en eller annen grunn.

Big data uten tillit vil gjøre at flere og flere reserverer seg mot å dele sine data, som er grunnlaget for big data. Derfor er ikke bare resultatene viktige, men også å opprettholde tillit fra de som generer alle disse dataene, altså deg og meg.

Rune Strømme er senior rådgiver i Friprogsenteret.
Rune Strømme er senior rådgiver i Friprogsenteret.

Hva er big data?

Big data er betegnelsen på en samling av strukturert og ustrukturert datasett som er så store og kompliserte at det blir vanskelig å behandle ved hjelp av tradisjonelle databaseverktøy eller tradisjonell databehandling. Utfordringene er mange og inkluderer datafangst, behandling, lagring, søk, deling, analyse og visualisering med mer.

Vi kan se på big data i form av de tre elementer: volum, hastighet og utvalg. Det er en enestående mengde av rådata som blir samlet inn, og med hver ny bølge av teknologi er det forventet å vokse eksponensielt. Dataene blir generert så raskt at tradisjonelle metoder for styring og analyse ikke virker. Og til slutt, datasettene er ulike og frakoblet, hvilket innebærer at analysen av de forskjellige databasene og tilgangsmekanismen er komplisert.

Tendensen er at vi søker til større og større datasett for å høste mer informasjon en det vi klarer fra separate små datasett.

Hva kan big data bety økonomisk?

Datamengden vokser 50 prosent eller mer hvert år. I 2010 var big data-bransjen på egen hånd verdt mer enn 100 milliarder dollar og vokste nesten 10 prosent i året! Det er omtrent dobbelt så raskt som programvarebransjen som helhet.

Hvilke problem kan big data løse?

Vi kan med big data finne ulike former for trender, vurdere kvaliteten på forskningen, forebygge sykdommer, bekjempe kriminalitet, og bestemme i sanntid trafikale forhold. I det hele tatt kan big data bidra innen mange fagfelt og vi ser også big data brukt på helt nye områder. Big data er raskt blitt en viktig faktor for innovasjon og beslutningsprosesser i industri, politikk, helsesektoren og så videre.

Utfordringer med big data

Volumet av data er allerede enormt og øker hver dag. Hastigheten av dataproduksjon og -vekst er økende, drevet av blant annet stadig nye enheter koblet til internett (tingenes internett – the internet of things). Videre er mangfoldet av data som genereres også i stor vekst. Organisasjoners evne til å fange opp og behandle disse dataene riktig og kontrollert, kan derfor være vanskelig.

Vi ser tilsvarende utfordringer med big data som vi har med opptelling av stemmer ved valg, disse prosessene må være transparente og kontrollerbare av alle som ønsker å kontrollere. Om vi ikke har mulighet til å kontrollere disse prosessene kan vi ikke stole på opptellingen av stemmene, ei heller resultatet fra big data.

  • Tillit til å dele data

    Big data kan bidra til å løse mange problemer, men bare hvis vi stoler nok på selskapene som forvalter dataene om oss. Eksempelvis om et stort antall berørte borgere nekter å dele sin informasjon, da vil datasettene umiddelbart begynne å utvikle mangler, og innsikten vil miste sin verdi.

  • Tillit til resultat

    Uten tillit til resultatene fra big data vil ingen kunne bruke de og markedet blir borte. Det er viktig at big data-virksomheter har gode retningslinjer og åpne prosesser som alle kan få innsyn i.

  • Kontinuitet

    Kan vi være sikre på at vi kan kjøre samme analyse om en måned eller to år? For at noen skal legge innsats i arbeidet med big data er organisasjon/selskap avhengig av kontinuitet på datagrunnlagene.

  • Åpenhet og transparent

    Som et eksempel skal vi ha rett til å få vite innholdet i algoritmer og prosesser som ligger til grunn for automatiserte avgjørelser som har vesentlig betydning for samfunnet eller den enkelte.

  • Personvern

    Datatilsynet er i stadig prosess for å sikre vårt privatliv.

  • Data kilder

    Vi må også ha åpenhet og transparente prosesser på data innsamlingen, slik at vi unngår at hackere (eks Snowden) må vise at innsamlingen og analysene er feil eller basert på ulovligheter.

Bør vi alle tenke oss litt mer om

Her er det mye som kan gå galt, alt i fra en programmeringsfeil, datafeil og/eller algoritmefeil. Videre skal det ingen feil til for å forskyve resultatene, kun en menneskelig misforståelse, og/eller manglende kunnskap eller feil kunnskap.

Forutsetning for bruk av big data

Vi i Friprogsenteret tror ikke det er nok å løse disse utfordringen separat for at vi skal ha tillit til resultatene fra big data. Vi ser så mange problemer at kun de aller enkleste analyser kan bevises å være riktige. Likevel stoler verden i økende grad på resultatene fra big data. Vi mener derfor at tiden nå er inne for å etablere retningslinjer for behandling av big data.

Som et resultat av en etisk debatt, bør ledere, sammen med sin markedsføring og juridiske avdeling og ikke minst sammen med konsulentene, utvikle etiske retningslinjer for big data. Disse retningslinjene bør inneholde en liste over prinsipper som beskriver hva en finner passende og upassende, tilpasset nasjonale lover, krav, etikk og normer.

Etablere en prosess som sjekker disse etiske retningslinjene under arbeidet med big data, kontrollere om det er juridisk brister. En prosess som gjør sjekk om en håndhever personvernloven, om den tiltenkte bruk av data passer der den faktisk skal brukes, og om organisasjon er 100 prosent komfortabel med at resultatene blir offentliggjort.

Vår anbefaling

Bruk av big data har et stort potensial for å forbedre, forenkle og fornye offentlige og private tjenester. Men en overflod av data og datakraft betyr imidlertid ikke at en er automatisk garanterer gode beslutninger. For at vi skal kunne bruke big data som beslutningsgrunnlag må organisasjonene, prosessene, kultur, dataene og teknologien være åpen for innsyn og kontroll. Hvis ikke er det overhengende fare for at utilsiktede feil kan oppstå og i alle fall vil vi miste tilliten til resultatene og selskapene.

Friprogsenteret anbefaler at det må etableres nasjonale rettningslinjer for bearbeidelse av big data, slik at alle kan få tillit til resultatene og innsyn i prosessene.

En enda viktigere årsak for å opprette retningslinjer er å sikre tillit til brukerne slik at de er villige til å dele egne data for fremtidige analyser.

Delta i debatten
Informasjon om debattinnlegg og kronikker i digi.no

Alle innlegg må sendes til redaksjon@digi.no. Husk å legge ved et portrettbilde. Vi forbeholder oss retten til å redigere innsendt materiale.

Til toppen