KOMMENTAR: Strategi for deling av offentlige data

Mens vi venter på regjeringens digitaliseringsstrategi – del 2

Verden endrer seg, og de standpunktene vi inntar, med den.

I 2012 mente Accenture at alle offentlige data (bortsett fra personsensitive data) burde forvaltes og utnyttes av Google. Det syntes daværende Difi-direktør, nåværende skattedirektør, Hans Christian Holte, var en god idé. I dag går han i bresjen for å skattlegge store internasjonale IKT-aktører fordi manglende skattlegging undergraver velferdstaten og skattemoralen.

Sitatet gir et interessant tidsbilde av hvordan debatten fullstendig har endret retning på få år. Ingen vil mistenke at skattedirektøren har samme standpunkt i dag.  Mange reiser tvert om spørsmålet om ikke staten må ta eierskap til offentlige data, og å bruke dataene strategisk til samfunnsøkonomisk verdiskapning. «Slipp dataene løs» er blitt en like meningsløs holdning som at vi i sin tid skulle slippe utenlandske oljeselskaper til for å pumpe opp olje og selge den videre, uten å betale skatt til Norge.

Er offentlige data den nye «oljen»?

Styreleder i Schibsted-konsernet, Ole Jacob Sunde, er blant dem som med historien som argument, peker på at hva som skjedde med oljen, der staten sikret eierskap til oljen i Nordsjøen og dermed la grunnlaget for et teknologidrevet industrieventyr. Han gir Jens Evensen æren for dette.

Nå er historien om oljen imidlertid noe mer sammensatt enn som så. Det var riktignok Jens Evensen (og andre) som etablerte et rammeverk for petroleumsvirskomhet i Nordsjøen for å sikre statens interesser i en eventuell oljevirksomhet (i 1965). Men det var Farouk Al-Kasim (og andre) som konstaterte at det var olje i Nordsjøen (i 1969), og la strategien for at oljen (og gassen) skulle ilandføres, noe som la grunnlaget for en norsk konkurransedyktig leverandørindustri. Når det gjelder forvaltningen av rikdommen, var det Arne Skauge (H) som fikk etablert oljefondet; det var Jens Stoltenberg (Ap) som fikk gjennom handlingsregelen; og det var Øystein Djupedal (SV) som fikk innført etiske regler for investeringer.

Strategien bak oljeeventyret er derfor både tverrfaglig og tverrpolitisk forankret, og blitt etablert over tid.

«Offentlige data» har en annen side

Analogien med  oljeventyret  halter imidlertid  på noen vesentlige punkter:

Dersom vi ikke har en strategi for deling av offentlige data, men slipper «dataene fri», vil dette endre maktbalansen i samfunnet: Verdien av  offentlige tjenester eller næringsvirksomhet reduseres til fordel for dem som kontrollerer dataene. Denne formen for «byttehandel» ser vi allerede i dag ved at vi (frivillig) gir fra oss en rekke personlige data som IKT-leverandørene benytter til kommersiell virksomhet.

Det bidrar også til å forskyve grenseoppgangen og arbeidsfordelingen mellom offentlig og privat sektor. Internasjonale IKT-aktører utnytter f.eks. dataene til å «krype inn i» verdikjeden for offentlige tjenester. Amazon blir et helsevesen, Google blir et «algoritmenes veivesen» etc.

Spørsmålet er hva Norge som nasjon skal ha kontroll over som motvekt til at store internasjonale IKT-aktører utnytter offentlige data til å utkonkurrere både næringslivet og forvaltningen.

Ett av de mest aktuelle områdene for strategisk eierskap og utnyttelse av offentlige data, er helsedata. Regjeringen la nylig frem en Stortingsmelding om helsenæringen. Direktør i Folkehelseinstituttet, Camilla Stoltenberg, mener meldingen er for lite konkret på dette området. Ressurser som er skapt av fellesskapet kan ikke være «gratis» til fri bruk, sier hun; «inntektene» av bruken må på en eller annen måte tilbakeføres til de etater som har «produsert» disse dataene på vegne av fellesskapet. 

Hva menes med «deling av data»?

«Deling av data» er heller ikke et ensartet begrep. En må skille mellom (1) det å dele data mellom etater, forvaltningsnivåer og i verdikjeder som også omfatter privat sektor, og (2) det å gjøre offentlige data åpent tilgjengelig «for alle».

Deling av data innenfor helse- og omsorgstjenesten og som grunnlag for forskning, er innenfor den første kategorien. Men det er flere eksempler. Skatteetaten arbeider med en ny løsning for innkreving av moms gjennom verdikjeden fra fastsetting til innkreving av moms. For noen dager siden ble eBevis lansert som lar offentlige innkjøpere innhente skatteopplysninger om leverandører både før og etter kontraktsinngåelse. Kartverket har i gang et prosjekt for innsamling og deling av data for å lage nye marine grunnkart i kystsonen. Brønnøysundregistrene lager felles informasjonsmodell-katalog som viser hvordan offentlig informasjon er strukturert slik at den lettere kan deles og forstås, osv. 

Alt dette er basert på «deling av offentlige data», ofte i samarbeid med privat sektor, og gir viktige bidrag til løsning av de samfunnsoppdragene etatene har: bekjempe arbeidslivskriminalitet, bedre omsorgs- og helsetjenester, sikre skipsfart i kystnære områder, etc.

Et annet fellestrekk er at dataene er strukturert, beskrevet og med definert semantisk innhold. Det betyr at etatene har oversikt over hvilke data den håndterer, hva dataene betyr, hva de brukes til, hvilke prosesser de inngår i og hvem som kan bruke dem (informasjonsforvaltning). 

Den andre kategorien er å legge rådata åpent ut til fri anvendelse, i form av en såkalt «datasjø».  Rådata innebærer at dataenes egenskaper og semantiske innhold ikke er beskrevet slik det er i eksemplene ovenfor; den kostnaden må den som benytter seg av dataene selv ta. I forslag til ny arkivlov «Fra kalveskinn til datasjø» sies det om «datasjø»: «For å kunne analysere (og forstå) informasjon på tvers av flere løsninger har en prøvd å lage felles datamodeller som så hver datakilde må tilpasse seg. Begrepet datasjø er kommet som en motvekt mot denne tankegangen. ….Med datasjøtankegangen tar en komplette kopier av datamodeller og benytter nye verktøy og metoder (slik som maskinlæring) for å analysere og finne nye sammenhenger som en tidligere ikke var i stand til å identifisere».

Man setter altså «datasjø» opp som et alternativ til «informasjonsmodellering. Noe av argumentasjonen er at store datamengder egner seg bedre for bearbeiding ved f.eks. kunstig intelligens til forskning og analyse. Argumentasjonen er faglig sett tvilsom, som en kan lese om i denne artikkelen av Per Myrseth.  Gartner Group sier at derecommends that organizations focus on semantic consistency and performance in upstream applications and data stores instead of information consolidation in a data lake”.

«Datasjø»-konseptet vil bli testet ut av Difi i 2020 og i årene fremover. Målet er «mer og bedre (sic!) deling og bruk av data».

Regjeringen har altså ingen strategi for deling av offentlige data, men kun et prøveprosjekt av en teknologisk løsning til en prislapp på over 100 millioner kroner.

«Med data skal landet bygges»?

Spørsmålet om «deling av offentlige data» dreier seg om noe langt mer enn teknologiske løsninger.

Forskning, næringsliv og deler av forvaltningen selv etterspør en nasjonal strategi for deling av offentlige data som kan komme samfunnet til gode i konkurransen med de store internasjonale IKT-aktørene. 

Når det gjaldt oljen, var vi forutseende: Både med hensyn til eierskap til fellesressursene, hvem som skulle  kunne lete og produsere olje/gass , hvordan den skulle skattlegges og hvordan dette skulle føre til økt verdiskapning i samfunnet.

Men når det gjelder «deling av offentlige data», har man ingen strategi for å sikre seg nasjonale eierrettigheter, en regulering som sikrer at utnyttelse kommer norske bedrifter og forskningsmiljøer til gode og at «inntektene» av bruken, tilbakeføres til de etater som «produserer» dataene.  

Difis Digitaliseringskonferanse er helt og holdent tilegnet dette temaet under mottoet «Med data skal landet bygges». Her har digitaliseringsminister Nikolai Astrup en enestående sjanse til å si hvilken strategi for «deling av offentlige data» Regjeringen egentlig har. 

Kommentarer (2)

Kommentarer (2)
Til toppen