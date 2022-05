Mange grunnleggende spørsmål forble ubesvart da EHiN arrangerte Helsedatadagen forleden.

Alle er enige om visjonen: Ved forskning på helsedata vil en kunne forutse sykdomsutvikling, utvikle diagnoseverktøy, forbedre pasientbehandlingen og utvikle nye og bedre legemidler. Forskning på helsedata redder rett og slett liv.

HAP har to formål:

Gi forskere enkel og sikker tilgang til norske helsedata fra helseregistre, befolkningsundersøkelser og forskningsbaserte biobanker.

Mulighet for å analysere og utforske hypoteser (for eksempel sammenhengen mellom sykdommer) inne i selve plattformen, uten å gå veien om å trekke ut datasett fra hvert register, for så å utføre analysen lokalt.

Schrems II-dommen innebærer at en ikke kan overføre persondataopplysninger til land utenfor EU/EØS. Siden HAP bygger på Microsoft Azure har det oppstått tvil om den skyløsningen som plattformen er basert på, kan brukes. Derfor settes for sikkerhets skyld plattformen, som skulle lanseres 1. april i år, på pause.

Schrems II-dommen «skremmer» bokstavelig talt aktørene. «Gullgruven» er delvis stengt – kanskje for alltid. Korrigerende tiltak iverksettes, alternativer utredes, og markedet forsikres om at tilgang til helsedata vil dekkes gjennom Helsedata.no og tilhørende servicefunksjon .

Men kanskje viktigst: Bruk av helsedata til analyse og forskning inne i plattformen må utsettes fordi det krever en skyløsning.

Helsedata i en datadrevet økonomi

Debatten om helsedata og HAP som selve «navet» i formidling og verdiøkning av helsedata er like forvirrende som den er kompleks: Begrepet «helsedata» er sammensatt; verdikjeden som helsedata flyter gjennom, er fragmentert og aktør-drevet, hvilke problemstillinger en anser for relevante, varierer fra om en ser det fra en jurists, informatikers, leges eller forskers synsvinkel.

Men for å forstå HAPs rolle og verdi i den sammenheng, må disse spørsmålene stilles:

Hvordan kan en beregne verdien (avkastningen) av deling av helsedata? Hvordan skapes, utvikles og forvaltes helsedata for å gi forventet og ønsket verdi? Hvordan skape betalingsvilje for bruk av helsedata til forskningsformål?

Hvordan beregne verdien av deling av helsedata?

Det svaret kan en finne i en masteroppgave . Studentene har stilt følgende spørsmål:

Hva er de viktigste driverne for viljen til å betale for datakvalitet?

Hvilken del av datakvaliteten er viktigst for å optimalisere muligheter og minske risiko?

Hvordan kan datakvalitet økes, og til hvilken kostnad?

Funnene er interessante:

Den viktigste driveren er at de initielle dataene må ha høy datakvalitet og kunne anvendes i flere bruksområder senere i verdikjeden. Funnene indikerer at investering i datakvalitet der dataene oppstår, spiller en avgjørende rolle for den videre verdiskapning. Det er tilbudssiden som spiller en størst rolle i den senere verdiskapning av helsedata.

Samtidig snus driveren for høy datakvalitet underveis i verdikjeden til å bli etterspørselsdrevet: Dess større tillit senere ledd i verdikjeden har til datakvaliteten på de data en mottar, og dess større forståelse dette leddet har for dataenes verdi i den forskningsmessige sammenheng de skal brukes i, dess større er betalingsviljen for dataene.

Dette er avgjørende for å forstå HAPs verdi og betydning:

Hvordan helsedata skapes, utvikles og forvaltes

De dataene og registrene som legges inn i HAP, er avhengige av hvilken datakvalitet de opprinnelige registerforvalterne har i sine data. Når det ikke er noen samforent forståelse og beskrivelse av datakvalitetsnivå mellom registerforvalterne, vil verdien av dataene være lav og forringes videre i verdikjeden. Dette er HAPs største utfordring, særlig når det gjelder formål 2 – Analysedelen, som jo går på forskningsrelatert bruk av data. Det er her betalingsviljen først og fremst oppstår.

HAP opererer med begrepet «dataprodukt», og definerer det som «datasett, metadata og bruksområder der en dataleverandør er produkteier», hvor det er den enkelte registerforvalter som leverer data til HAP som har ansvaret for «bearbeidelsen» av dataene. Ved denne tilnærmingen mener en at en legger til rette for «et økosystem av dataleverandører som kan publisere ulike dataprodukt på plattformen».

Når HAP er prisgitt dataleverandørenes ulike bearbeidelse av dataene med ulik datakvalitet, hvordan kan en da oppnå betalingsvilje hos brukerne av plattformens data?

Datakvalitet kan inndeles i ulike dimensjoner: Syntaktisk datakvalitet (teknisk riktig format og struktur), semantiske datakvalitet (data beskriver virkeligheten korrekt) og pragmatiske datakvalitet (egnet til det bruksområde de skal anvendes i). Data kan for eksempel være av høy syntaktisk og semantisk kvalitet, men lav pragmatisk kvalitet (ikke egnet til bruk fordi data ikke var på rett sted til rett tid).

De registre som dataene forvaltes i, er også forskjellig. Det er retrospektive (historiske) dataregistre (hvor epikrisen oppbevares), sanntids-registre (som gir grunnlag for beste behandling her og nå) og projektive registre som gir grunnlag for bedre beslutninger, nye behandlingsformer og nye medisiner.

Bruksområdene er også forskjellige: Behandling, forebygging, forskning – og i økende grad kobling til aggregerte data om befolkningsgrupper. Vi så det under pandemien at folk på østkanten i Oslo, ble sykere enn de på vestkanten. Dette har sammenheng med sosiale, økonomiske og kulturelle forskjeller, som igjen legger grunnlaget for sosial ulikhet i helsebehandlingen. I slike sammenhenger må derfor helsedata kobles til sosio-økonomiske data, med de nye utfordringer det har for datakvaliteten.

Problemet med å bruke helsedata fra HAP til forskning, vil derfor ikke bare ligge i manglende initiell datakvalitet. Ulik dataforvaltning over tid og uklar rolleforståelse mellom aktørene når data skal overføres til neste ledd i verdikjeden, vil også skape problemer. Er dataene gode nok til det formål de skal brukes til i neste ledd? Hvem har ansvaret for hva?

Hvordan skape betalingsvilje?

HAP vil koste ca. 300 millioner kroner å utvikle. Driftskostnadene, inklusive Helsedataservice og tjenestene på helsedata.no, vil ifølge Direktoratet for e-helse beløpe seg til 80 – 110 millioner kroner i året. Stykkprisen for bruken vil avhengige av hvor mange som bruker plattformen og hvor ofte. Ifølge en prisliste som Direktoratet presenterte i fjor, vil Kreftregisterets utgifter til bruk av helsedata 10-dobles!

Helsedata må ikke ses på som en kostnad, men som en verdi. Verdien ligger i hvilken datakvalitet dataene får der dataene oppstår. Det vil være avgjørende for verdiskapningen senere i verdikjeden. Følgelig må en del av verdiskapningen ved bruken av helsedata føres tilbake til registerforvalterne. «Hvem bruker mine data til hvilket formål?». Det er avgjørende for senere verdiskapning av dataene.

Verdien finnes altså før dataene lastes inn i HAP, og i den senere bruk . Hvilken merverdi skaper da HAP foruten å lette tilgangen til ulike datasett?

Merverdien vil eventuelt ligge i analysedelen hvor det legges inn eksplorative analysetjenester og verktøy. Disse vil kunne utnyttes ved hjelp av bl.a. kunstig intelligens. Men det vil bare være en liten del av forskning på helsedata som vil kunne gjøres ved «robotisering».

Hva nå?

Direktoratet for e-helse er pålagt å se etter (midlertidige?) alternativer til HAP: Gjenbruke løsninger som allerede er i drift i universitets- og høyskolesektoren her i landet; eller utvikle hybride skyløsninger i regi av Norsk Helsenett.

Pausen bør brukes til å diskutere hvordan helsedata kan få økt datakvalitet som i sin tur øker etterspørselen og nytten av slike data. Plattformen slik den er innrettet i dag vil ikke kunne levere en datakvalitet som markedet er villig til å betale for.

Kjør debatt!