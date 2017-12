VIKA, OSLO (digi.no): Det å avdekke mulige ulovligheter som egne eller tidligere ansatte har begått mot en arbeidsgiver, kan være en stor belastning for enhver virksomhet. Ofte har man bare et nokså tilfeldig tips eller en magefølelse å ta utgangspunkt i.

I mange tilfeller finnes det elektroniske spor som kan brukes som bevis. Men å finne disse sporene kan være vanskelig. Både fordi sporene kan være skjult i kanskje millioner av dokumenter, eposter, logger og annen digital informasjon, men også fordi den eventuelle motparten i stor grad forsøke å skjule disse sporene.

Det er bortimot en helt umulig oppgave for mennesker å lese gjennom millioner av dokumenter, og selv om vanlig søketeknologi kan være til hjelp, er det ofte vanskelig å finne fram til de dokumentene som er relevante i saken.

Samtidig kan det virke som at informasjonstyveri gjort av utro tjenere er et økende problem.

Temmelig utbredt

På vegne av revisjons- og rådgivingsselskapet BDO har YouGov gjennomført en undersøkelse blant norske ledere som forteller at hver tiende virksomhet har anmeldt andre for tyveri av informasjon eller har blitt beskyldt for dette selv.

– Disse tallene er ikke veldig overraskende. Vi ser også at det er store mørketall. Omdømmetap er veldig ofte en årsak til at man ønsker å rydde opp internt. Dessuten er det ofte en stor belastning å kjøre slike prosesser mot ansatte eller tidligere ansatte, dersom man har mistanke om at informasjon har kommet på avveie, sier Thomas Dahl, som er leder for datagranskning hos BDO.

Han har tidligere jobbet med tilsvarende tematikk hos blant annet Økokrim, Kripos og Ibas.

Stor belastning

YouGov-undersøkelsen viser også at mer enn ti prosent av virksomhetene har benyttet seg av eksterne granskere for å avdekke eller føre bevis for at det har vært begått tyveri av forretningshemmeligheter. Tradisjonelt har dette foregått ved at granskere ofte i lang tid har vært tilstede i virksomhetene og blant annet intervjuet ansatte. Ifølge BDO kan dette være en inngripende affære for alle involverte.

Dette er noe av bakgrunnen for at BDO har tatt i bruk en løsning som både kan redusere belastningen på virksomheten, føre til raskere funn og som angivelig gir minst like gode resultater som de tradisjonelle metodene.

eDiscovery

Det dreier seg om et såkalt eDiscovery-system levert av Relativity. Dette tar i bruk maskinlæring og en viss grad av kunstig intelligens for å finne opplysninger som er relevante i en granskning.

Thomas Dahl er leder for datagranskning hos BDO. Foto: Harald Brombach

– Vi bruker dette som base. Alle granskerne våre bruker dette som et arbeidsverktøy. Da har vi kontroll på dokumentflyten og sporbarhet på hva vi gjør og hvilke dokumenter vi ser på. Det er en del personvernregler som vi må forholde oss til hele tiden. Blant annet private dokumenter skal arbeidsgiveren i utgangspunktet ikke ha innsyn i, sier Dahl til digi.no.

I bunnen av systemet står det et titalls servere som utfører forskjellige oppgaver, og som snakker sammen.

– De har en rekke agenter som utfører ulike oppgaver, og som er satt opp for å gjøre det hele mest mulig effektivt. Dette er ikke vanlig hyllevare, sier Dahl.

Systemet strukturerer og lagrer data i underliggende SQL-databaser, noe som gjør det mulig for BDO å bruke andre verktøy mot de samme dataene.

Ikke lenger på forskningsstadiet

– Kunstig intelligens og maskinlæring var tidligere bare på forskningsstadiet ved universiteter og andre forskningsmiljøer, hvor man har lekt med algoritmer for å se om de ga noen mening. Men nå er jo dette tilgjengelig teknologi som blir brukt med hell innenfor mange forskjellige områder, forteller Dahl.

– Det gjelder også det vi driver med, som er granskning. Vi jobber veldig mye med big data, ved at vi bistår kunder med å kartlegge fakta. Da går vi inn i epost, dokumentasjon, arbeidsflyt og regnskap for å prøve å finne avvik eller fakta som kan underbygge en tese om hva som har skjedd, fortsetter han.

Han nevner et scenario hvor man har to millioner dokumenter og eposter, kombinert med en tese som man ønsker å få bekreftet eller avkreftet.

Søkeord

– Måten vi angriper det på varierer, men vi starter ofte med å benytte stikkord eller søkeord, som vi tar utgangspunkt i, forteller Dahl.

– Det er vanskelig å finne relevante søkeord. Hvilke begreper og betegnelser brukes for å omtale det man driver med? For eksempel i forbindelse med underslag: det er ingen som kaller det de gjør for underslag. Når vi har funnet de relevante begrepene og betegnelsene, kjører vi disse søkeordene gjennom og ser hvor mange treff vi får på disse ordene. På noen søkeord får vi kanskje ti tusen treff. Det er ikke godt nok for oss. Vi må ha litt færre dokumenter. Det vi ofte gjør da, er at vi tar ut et treningssett, for eksempel 2500 dokumenter blant dem som får treff på disse søkeordene. Dette treningssettet går vi gjennom manuelt og tagger dokumentene som relevante eller ikke-relevante, sier Dahl.

Assistert maskinlæring

Deretter tar granskerne i bruk det de kaller for assistert maskinlæring.

– Da får vi systemet til å gjenkjenne hva som går igjen i disse relevante dokumentene og finner blant annet hva som er tema, hvordan er de konstruert og hvilke personer eller entiteter blir omtalt, forklarer Dahl.

Basert på disse opplysningene kan systemet ved hjelp av maskinlæring og ulike algoritmer finne tilsvarende og kanskje relevante dokumenter i hele dokumentsamlingen.

– Så går vi gjennom disse og tagger dem som relevante eller ikke-relevante. Deretter kan vi kjøre en ny treningsrunde på de dokumentene som vi har tagget som relevante. Det er veldig spennende og det funker! Vi ser at det faktisk gir veldig gode resultater, sier Dahl.

En annen søketeknikk som BDO benytter, er å få systemene til å hente ut hvilke andre ord som går igjen i de dokumentene som de får treff på med søkeordene.

– Hva er det diskusjonene dreier seg om? Da får vi forslag til nye søkeord som kan treffe enda bedre på det vi er ute etter å finne.

«Clustering»

Granskerne benytter også det Dahl kaller for «clustering» eller gruppering av dokumenter, noe som gjør det mulig å se visuelt hvilke temaer det er som går igjen og hvor mye felles dokumentene har med hverandre. Granskerne kan da klikke seg nedover i clusterne som inneholder de ordene som kan være interessante, relatert til det de forsøker å finne ut av.

Videre kan man kjøre lister med søkeord mot disse clusterne og få uthevet de av clusterne som får treff på disse søkeordene.

(Artikkelen fortsetter under)

Det er passende nok Enron-data som brukes i Relativitys bilder av selskapets eDiscovery-løsninger. Her vises de nevnte clusterne hvor dokumenter grupperes etter tema. Skjermbilde: Relativity

De relaterte dokumentene vil da gjøres tilgjengelige for videre analyser i det samme brukergrensesnittet.

– Men dersom vi ser at det vi treffer, er helt irrelevant, betyr det at søkeordene våre ikke er gode nok. Da må vi tagge disse dokumentene som irrelevante og kjøre maskinlæringen på nytt igjen med dette som input.

– Dette gir oss en veldig god måte å raskt finne fram blant de millionene av dokumenter som vi jobber med, sier Dahl.

Også hos motparten

Han forteller at man med utgangspunkt i tvisteloven kan anmode om bevissikring utenfor rettssak hos for eksempel en konkurrent som man mistenker at har mottatt informasjonen som har blitt stjålet. Dette er en mulighet mange ikke er så kjent med, ifølge Dahl.

– Hva sitter de på av informasjon som stammer fra oss? Dette er en rettslig prosess hvor man ofte bruker namsmannen og teknisk sakkyndige i forbindelse med gjennomføringen av bevissikring. Det vil være en sakkyndig som må gå gjennom materialet og finne eventuelle bevis på at informasjon har kommet på avveie, forteller Dahl.

– Dette er jo en omfattende prosess, og det er ofte dyrt å bruke sakkyndige på den typen oppdrag, fordi det ofte tar veldig lang tid å gå gjennom informasjonen. Det er her denne teknologien kommer inn og gjør at terskelen blir lavere, ved at arbeidet som den sakkyndige må gjøre, blir vesentlig redusert, sier Dahl.

Helt nye muligheter

Noe statistikk over hvor mye tid som kan spares ved å bruke denne teknologien, kan Dahl likevel ikke presentere.

– Men av egen erfaring opplever jeg at teknologien har åpnet helt nye muligheter for oss. Vi bruker nå mye mer av tiden på å gå gjennom den dokumentasjonen som er relevant, istedenfor å lete etter dokumenter. Og vi har blitt mye mer effektive i måten vi går fram på, etter hvert som vi har blitt mer komfortable og trygge på at teknologien faktisk gir riktige resultater, sier Dahl.

Verktøykassen til BDO-granskerne består også av andre muligheter. For eksempel har de tilgang til funksjonalitet som gjør det at det er mulig å se hvilke avsendere i en eposttråd som granskerne ikke har original-eposten fra.

– La oss si at du har en eposttråd som har gått ti ganger fram og tilbake. Da er det kun den siste eposten vi trenger å se på. Den inneholder akkurat den samme informasjonen som de ti foregående. Men så kan det være en epost som inneholder et vedlegg, som ikke er med i den siste meldingen i tråden. Da må vi også ha tilgang til denne epostmeldingen.

– Det kan også være at personer går ut av tråden og diskuterer dette bare seg imellom. Begge deler kan vi identifisere og visualisere ved hjelp av dette verktøyet, sier Dahl.

(Artikkelen fortsetter under)

Også eposttråder kan analyseres ved hjelp av systemet som BDO bruker. Skjermbilde: Relativity

Han forteller videre at granskerne kan be verktøyet om å finne dokumenter som er nesten, men ikke helt, identiske. Dette kan brukes til å blant annet å finne tidligere versjoner av for eksempel den samme kontrakten eller testamentet, basert på tekstinnholdet.

– Det er kombinasjonen av alle disse teknologiene som gjør det mulig å raskt drille ned til det vi ønsker å se på, forteller Dahl.

Ofte er det flere granskere som jobber sammen. Dersom det for eksempel er dokumenter som er på tysk, vil disse automatisk tildeles den eller de i gruppen som kan tysk. Dette fordi systemene har språkgjenkjenning innebygd.

– Vi bruker også en del lavkost-programmer, som RapidMiner og andre data mining-løsninger, til ting som eDiscovery-applikasjonen ikke håndterer på en god måte.

Også andre bruksområder

– Denne teknologien er nyttig for flere typer saker utover granskning. For eksempel kan det brukes i forbindelse med GDPR (den nye personvernforordningen, journ. anm.) til å finne hvilke av dokumentene til en bedrift som inneholder personsensitiv informasjon. Vi bruker akkurat de samme systemene til å identifisere slik informasjon i store datamengder, forteller Dahl.

Skepsis

– Det vi jobber med nå, er å få advokatstanden til å akseptere ny teknologi og at dette er noe vi må bruke. De stoler ennå ikke helt på teknologien, så vi bruker ganske mye tid på å demonstrere og argumentere for fordelene med å bruke kunstig intelligens og maskinlæring for å kunne finne fram til fakta i store informasjonsmengder, sier Dahl.

Han mener for øvrig Norge henger litt etter en del andre land når det gjelder modenhet for å ta i bruk ny teknologi, men innrømmer samtidig at man fortsatt må ha den lille skepsisen til at det ikke fungerer.

– Du må hele tiden etterprøve og å prøve andre innfallsvinkler. Man kan ikke ta for gitt at systemet finner all relevant informasjon, og det er viktig å ha «politiøyet» for at forklaringen fra systemet kanskje ikke er riktig. Så det er fortsatt mye menneskelig inngripen. «Find evidence»-knappen, som gjør alt automatisk, er ikke implementert i løsningen ennå. Du må fortsatt bruke erfaring og sunn fornuft, sier Dahl.

Ansetter

– Det er en kobling mellom kompetanse og teknologi. Vi ansetter nå folk med kompetanse og utdanning innenfor maskinlæring, blant annet fra NTNU. Én ting er å ha funksjonaliteten i systemene. Du skal også forstå hva den faktisk gjør. Det er ikke bare å trykke på noen knapper, og så få et eller annet presentert. Det å vite om algoritmene som blir brukt, er gode nok eller ikke, og å forstå hva som skjer under overflaten, er utrolig viktig, sier Dahl.

– De fleste store konserner har i dag rapporteringssystemer med en del av denne teknologien innebygd, i form av business intelligence- og analytics-funksjonalitet. Men de forstår ikke helt hvordan de skal ta det i bruk. Så her er det en lang vei å gå, hevder Dahl.

På spørsmål om hvordan etterspørselen etter slike tjenester egentlig er, svarer Dahl at den fortsatt ikke er så stor. En del kunder er det likevel, og Dahl antyder at de seks spesialistene til BDO på dette fagområdet, alle ingeniører, har mer enn nok å gjøre.

– Det er alt fra små og mellomstore bedrifter til konsern. Det kan være en liten kommune i Nord-Norge som har en eller annen habilitetsutfordring, som ber oss kartlegge innkjøpsprosesser og så videre. Eller det kan være store konserner som har utfordringer knyttet til korrupsjon, brudd på etisk regelverk eller lignende, sier Dahl.

– Vi bruker dette systemet både i veldig små saker og i store saker for å finne kjernen i saken, avslutter han.