Espen Andersen, førsteamanuensis ved BI

I en datadrevet bedrift slutter ikke ledere å ta beslutninger - men beslutningene handler ikke lenger om hva som skal gjøres, men hvilke modeller som skal brukes til å bestemme hva som skal gjøres.

Verden blir stadig mer datadrevet. Å være datadrevet vil si at man tar beslutninger på grunnlag av data, ikke intuisjon. Dette er et problem for mange ledere, siden de er vant til å bestemme basert på hva de tror og ikke hva fakta (eller i alle fall data) sier. Men det kan gi betydelige økonomiske resultater - Finn.no, for eksempel, har en datadrevet ledelses- og beslutningsprosess som leverer 1000 oppdateringer i uken og en EBITDA på 37%, år etter år.

Men hvilke beslutninger gjenstår for en ledelse i en bedrift der det er dataene, eksperimentene, og modellene - ikke hva ledelsen tror og mener - som bestemmer hva som skal gjøres?

Svaret er at de i hovedsak at de skal bestemme kriteriene for hvordan modeller og data skal brukes.

Her er et eksempel fra en medisinsk virkelighet: Hva om vi bruke en datamodell for å avgjøre om en føflekk inneholder kreftceller eller ikke. Vi har en rekke mål for føflekker (lengde, bredde, farge, regularitet, form) og for pasientene fra tidligere undersøkelser. Vi tar alle disse dataene, gir dem til en dataanalytiker og ber vedkommende lage en modell som kan forutsi om en føflekk er kreft eller ikke. Analytikeren programmerer i vei og kommer frem til en modell som gjetter riktig i 90% av tilfellene.

Over til lederen: Er denne modellen bra nok, og skal den tas i bruk?

I utgangspunktet virker det enkelt - hvor bra er modellen i forhold til hva som gjøres nå? Hvis en lege som undersøker en pasient finner riktig diagnose i bare 80% av tilfellene, er det jo enkelt: Da bruker man algoritmen. Dette at enkle algoritmer er mer korrekte enn ekspertvurderinger er en kjent sak - det er årsaken til at vurderingen om ditt nyfødte barn skal i kuvøse eller ikke blir tatt basert på en enkelt poengsystem (APGAR) hvem som helst kan gjøre i stedet for at en fødselslege eller sykepleier tar en vurdering basert på erfaring.

Men ting er mer komplisert enn som så. Alle modeller gjør feil, men hva slags feil gjør de? Det man må gjøre, er å lage det som på engelsk heter en confusion matrix (og som ikke har noen norsk navn, men hvorfor ikke “forvirringsmatrise”) som kan se slik ut:

Denne matrisen viser en modell som er 90% korrekt - den har funnet 80 tilfeller som ikke var kreft, og 10 som var det. Men den har tatt feil i ti av tilfellene: To der det var kreft men den predikerte ikke-kreft (falsk negativ), åtte der den trodde det var kreft men det ikke var det. Hvis en lege har 80% feilrate, ser det jo ut til at denne modellen er bedre.

Men… feil er ikke feil. Det er opplagt mye mer alvorlig med en falsk negativ (det er kreft, men man finner det ikke) enn en falsk positiv (at man tror en pasient har kreft, men tar feil).

Sett at man har en annen modell (eller endrer litt på den man har, for eksempel ved å sette lavere kriterier for å vurdere noe som kreft) og får en modell som ser slik ut:

Denne modellen har en treffsikkerhet på 82% - dårligere enn den første modellen - men den finner alle krefttilfellene.

Skal man kunne velge en riktig modell, må man ha kunnskaper om konsekvenser - både hva modellen skal måles opp mot, og hva konsekvensene vil være om modellen tar feil (noe den helt sikkert gjør.)

Dette er ikke en avgjørelse man kan overlate til teknologene - i dette tilfelle dataanalytikerne. Å finne modeller som fungerer er en jobb for spesialister. Å velge riktig modell basert på konsekvensene av å ta den i bruke er et lederansvar man ikke kan løpe fra - og en forutsetning for å skape den data-drevne bedriften.