- Difi bedriver PDF-hærverk

Skriver ut elektroniske dokumenter på papir.

- Difi bedriver PDF-hærverk
Høringssvaret fra EFN og FriBit har blitt «maltraktert» av IT-direktoratet, som skriver ut og OCR-skanner dokumenter. Bilde: Marius Jørgenrud

I offentlig sektor er det vanlig å skanne inn skriftlige dokumenter som bilder før lovpålagt arkivering. Slik blir papir til digitale bildefilder.

Men også originale elektroniske dokument blir skrevet ut på papir, før saksbehandlere signerer dem manuelt, skanner inn og OCR-behandler papirene (teknologi for tekstgjenkjenning).

Prosessen kan ødelegge formatering. Metainformasjon og lenker blir borte. Skrivefeil introduseres. I verste fall blir dokument ødelagt og uleselig for blinde og svaksynte.

Dette skjer også hos de som har fått mandat til å digitalisere statsforvaltningen, Direktoratet for forvaltning og IKT (Difi).

«Maltraktert»

Etaten blir nå beskyldt for å drive «dokumenthærverk» av interesseorganisasjonene Elektronisk Forpost Norge (EFN) og FriBit.

Deres felles høringsuttalelse (pdf) til ny forskrift om IT-standarder i forvaltningen er nemlig blitt «maltraktert» av direktoratet.

- Jeg ser de har tatt en nydelig, velformatert, lenket PDF, skrevet den ut, stemplet den, skannet den og lagt den ut. All formatering, hyperlenker og så videre er borte. Og dette er Difi?!?

Det skriver forhenværende leder, nå styremedlem i FriBit Øystein Jakobsen på epostlisten til EFN.

OCR-behandlinger har sine svakheter Bedre enn alternativet

- Det er riktig, som FriBit påpeker, at den innskannede versjonen av høringssvaret de viser til, ikke er 100 prosent. Difi opplever, som andre brukere av slike tjenester, at OCR-behandlinger har sine svakheter. Vi mener imidlertid at det er bedre enn alternativet, uttaler direktoratets seniorrådgiver Kristian Bergem til digi.no.

I det aktuelle høringssvaret har ord som «formatet» blitt endret til «fonnatet». Dette synes ikke direkte på skjerm eller utskrift, men ved opplesing.

En svaksynt eller blind person vil allerede i dokumentets innledning bli servert kryptiske kråketær og uforståelig innhold som dette:

...«HØRINGSUTTALELSE 2012/498:

Direktoratet for

forvaltning og IKT

o4OKT 201Z

Sak 2 o 2. r9j- f1.I ~,vd . ,-

Arkiv _~_~_Z--=-•-f5.beh. M

- Hvis dokumentet skal «omformateres» eller «konverteres», slik for eksempel jeg må gjøre, fordi jeg leser teksten som elektronisk punktskrift (braille), blir det ineffektivt og lite motiverende å laste ned og lese slike dokumenter, skriver en synshemmet person på EFN-listen.

Vurderer ny forvaltningsstandard
Hva kan IT-direktoratet gjøre for å unngå at dokumentene i forvaltningen blir endret på denne måten?

Seniorrådgiver Kristian Bergem svarer at Difi vurderer om det bør lages en forvaltningsstandard som krever OCR-skanning av innkomne dokumenter, blant annet for å gi bedre tilgang for blinde, svaksynte og folk med lese- og skrivevansker.

- Med de løsninger Difi benytter, krever dette korrekturlesing og tagging av dokumentet i etterkant, og det krever merarbeid hvis offentlige virksomheter skal publisere høringssvar eller gi innsyn i innkommet dokumentasjon. Difi jobber med å lage en standard som ivaretar hensynet til universell utforming uten å påføre offentlige myndigheter en uforholdsmessig byrde, skriver Bergem.

Men hvorfor må offentlige virksomheter skanne papirdokumenter hvis det, som i dette tilfellet, foreligger en digital original. Er det ikke mulig å signere/stemple disse elektronisk?

Her er det Difis arkivleder Jeanette Larsen som svarer:

- Foreløpig har Difi elektronisk journal med saksdokumenter på papir, og er omfattet av regelverket i Forskrift om offentleg arkiv, som sier at mottatte saksdokumenter skal stemples med en gitt informasjon. I tråd med vanlig praksis blir også dokumenter mottatt elektronisk behandlet på denne måten. Difi er i ferd med å innføre elektronisk arkiv, og når det er på plass, vil stempling ikke lenger være nødvendig.

Larsen påpeker at innskanning i etterkant av stemplingen i dag kun gjøres for å ha muligheter for å søke opp igjen dokumentene etter at det fysiske arkivet er satt bort.

- Dette har stor verdi internt, selv med kjente svakheter i OCR-tolkningen, opplyser hun.

- Er det ikke et poeng å bevare også lenker og metainformasjon, samt sørge for at dokumentene beholder opprinnelig tekst og formatering?

- Å sikre at dokumentene har den nødvendige integriteten når det gjelder å bevare den opprinnelige teksten, inklusiv formateringer og funksjonalitet, er en av mange problemstillinger som vi må vurdere ved overgangen til elektronisk arkiv. Vi jobber derfor med å sikre at dokumenter blir overført til arkivdatabasen i sin opprinnelige form, og låst i henhold til kravene i lovverket. Det inkluderer å kvalitetssikre at funksjonalitet som lenker i et dokument, er brukbare, svarer arkivleder Larsen.

Papir skal bli overflødig

Spørsmålet er hvordan dagens praksis rimer med regjeringens varslede digitaliseringsprogram, der planen er å gjøre digital kommunikasjon til hovedregelen i all omgang med det offentlige.

- Digitaliseringsprogrammet sier at i fremtiden skal digital kommunikasjon være hovedregelen. Det vil gjøre innskanning av papir overflødig over tid, men i en overgangsfase er det viktig at offentlige virksomheter kan motta papir og gjøre dem tilgjengelig for alle, også for de som for eksempel benytter leselist. Da er OCR-skanning og tagging et viktig virkemiddel for å understøtte hovedregelen, sier Difi-seniorrådgiver Kristian Bergem.

    Les også:

Les mer om: