Mona Strøm Arnøy (Bilde: BankID)

Slik kollapset BankID

Menneskelig svikt og følgefeil i backupen satt systemet ut av spill.

Onsdag kollapset det kritiske systemet som håndterer 2,5 millioner nordmenns sikre pålogginger til blant andre banker og flere offentlige tjenester. BankID startet morgenen med å være ustabil og fra kl. 0900 om morgenen til 12.00 om formiddagen var hele tjenesten, unntatt mobiltjenesten, ute av drift.

Nå foreligger forklaringen på hva som gikk galt.

- Feilen var knyttet til daglig vedlikehold av databasen, som er en sentral komponent i Bank ID. Feilen har utviklet seg over en 14 dagers periode og resulterte til slutt i at hele systemet gikk ned, sier Mona Strøm Arnøy, som er kommunikasjonssjef i BankID, til digi.no Hun forteller at lokaliseringen av feilen var vanskelig og tidkrevende.

- Det var svært vanskelig å isolere hvor feilen skjedde, om det var i applikasjoner, i infrastrukturen eller i maskinvaren, sier Arnøy.

Den menneskelige svikten kom i forbindelse med en gjennomgang av databasen og førte til at en automatisert databasegjennomgang, beskrevet av BankID som en "automatisert vaktmester", holdt på i 14 dager før den sørget for at systemene raknet. Systemet klarte ikke å fjerne gamle sesjonsdata som da hopet seg opp.

Da kollapsen var et faktum ble backup-løsningen forsøkt kjørt inn for å redde situasjonen. Nye maskiner tok over driften, men siden man på det tidspunktet ikke visste at feilen lå i databasen ble problemene importert over i backup-løsningen.

- Vi kjører en full varm backup hele tiden. Men akkurat denne databasen, som inneholder sesjonsinformasjon fra brukerne, ble med over, sier Arnøy.

Konsekvensen var at også denne ikke fungerte – og tjenesten lå fremdeles nede.

- Feilen ble med på kjøpet, sier Arnøy til digi.no.

Det er Nets, selskapet som tidligere gikk under navnet Bankenes Betalingssentral, som drifter infrastrukturen til BankID, men det er BankID som er fullt ut ansvarlig for denne.

Nå må Nets og BankID redegjøre ovenfor Finanstilsynet om hvordan dette kunne skje - og hvilke grep som gjøres for at slike hendelser ikke skjer igjen.

Til toppen