Annonsørinnhold fra  
Advertiser company logo

Grepet som har økt endringstakten i DNB

Avesh Godase og Satya N. Sundararajan jobber med Site Reliability Engineering (SRE) i DNB. Foto: TUM Studio
Avesh Godase og Satya N. Sundararajan jobber med Site Reliability Engineering (SRE) i DNB. Foto: TUM Studio
Del
Produsert av TUM Studio

Da Avesh Godase og Satya N. Sundararajan kontaktet ti ulike team i DNB for å gjøre jobbhverdagen deres enklere, var det kun ett team som kastet seg på. For de andre var forklaringen den samme: Site Reliability Engineering (SRE) hørtes fint ut i teorien, men paradoksalt nok strakk ikke tiden til.

SRE handler om å sikre at IT-systemer er pålitelige, skalerbare og effektive. Denne praksisen kombinerer prinsipper fra programvareutvikling med operasjonelle prinsipper for å oppnå dette.

– Heldigvis var det ene teamet alt vi trengte. Da de kunne fortelle om sine erfaringer, åpnet det mange dører videre i DNB, forteller Satya.

Han er SRE-ekspert i DNB-enheten Tech Operations & Support, som ledes av Avesh. Begge hadde vært tilknyttet DNB som konsulenter før de for henholdsvis to og fire år siden ble fast ansatte. Nå sitter de ved hovedkontoret til DNB i Bjørvika og jobber for å øke endringstakten i alle ledd. 

 Leder for DNB-enheten Tech Operations & Support, Avesh Godase. Foto: TUM Studio 
 Leder for DNB-enheten Tech Operations & Support, Avesh Godase. Foto: TUM Studio 

– Noen er redde for å stagnere i en stor organisasjon som DNB, men jeg så det som en utfordring å ta del i en gjennomgripende modernisering som den vi står oppe i nå, sier Avesh.

Som Norges største finanskonsern har DNB en samfunnskritisk rolle. Da er det essensielt at moderniseringstempoet ikke går ut over påliteligheten.

– Det handler både om folkene og om teknologien. En teknologisk omstilling krever at man tar til seg ny kunnskap og nye måter å jobbe på. Der spiller SRE en viktig rolle, utdyper Satya.

Frigjorde mye tid med automatisering

Det var Google som i 2003 etablerte Site Reliability Engineering da de så behovet for en mer automatisert tilnærming. 

Metodikken inkluderer overvåkning av systemer, respons på hendelser, skyldfri rotårsaksanalyse, utvikling av verktøy for automatisering av operasjoner og samarbeide med produktutviklingsteam for å bygge robuste systemer.

– Bærekraft er et nøkkelord. Det gjelder å utvikle løsninger som til enhver tid ligger på et riktig nivå av pålitelighet. Man kan ikke ta høyde for at det er black friday hver eneste dag, sier Satya.

– Det er heller ikke om å gjøre at ethvert system skal være det beste. Da må du investere i mye som egentlig ikke trengs. Man må spørre seg hvilke ressurser som er nødvendige for å nå et bærekraftig nivå, verken mer eller mindre, fortsetter han.

Noe av det første SRE-teamet gjorde var å ta tak i tjenester som DNB overvåket 24/7.

Satya N. Sundararajan i DNB. Foto: TUM Studio 
Satya N. Sundararajan i DNB. Foto: TUM Studio 

– Ved å automatisere overvåkningen av disse tjenestene så frigjør man tid, uten at det trenger å gå ut over kvaliteten på arbeidet.

Med andre ord skal det gå like raskt å håndtere et problem som før. Forskjellen er at ved å automatisere så kan de ansatte bruke tiden de sparer til andre oppgaver.

Straks det oppstår et symptom på driftsproblemer, sendes en sms til den personen som til enhver tid er ansvarlig. Responderer han ikke i løpet av minutter, varsles sjefen for avdelingen.

Det er brukerne som avgjør 

– Brukeropplevelsen står i sentrum for SRE. Det er brukerne som avgjør om et produkt oppleves som pålitelig eller ikke. Målsetningen er å bygge produktene slik at vi kan fange opp problemer og løser dem i forkant, sier Avesh.

– Pålitelighet handler ikke bare om tilgjengelighet, men også om hastighet, om hvordan produktene våre responderer. Ved å måle dette ut fra et brukerperspektiv, kan vi lettere finne ut hvor lista for pålitelighet bør ligge, utdyper Satya.

Også bankens brukere skal ha enkel tilgang til data som viser eventuelle problemer. På dnbstatus.no kan du sjekke om alle systemer fungerer som de skal, og hvilke som eventuelt ikke gjør det. Her ligger dessuten info om planlagt vedlikehold og hendelser de siste 48 timene.

– Internt kan vi dykke ned i dataene for å se hvor det kan være rom for forbedringer. Vi kan ta databaserte avgjørelser - bør vi investere i å utvikle produktet, øke kapasiteten eller legge innsatsen et annet sted, sier Satya.

Rom for å feile - uten pekefinger 

En av de største utfordringene er at teknologien endrer seg mye raskere enn før. Det kommer stadig nye apper, nye måter å gjøre ting på, og bankene må henge med i utviklingen.

– Når du gjør endringer raskt, er du dømt til å feile. Da er det viktig å jobbe strukturert, slik at man kjapt kan fange opp feil uten at det får store følger, sier Satya.

– Vi har også en kultur der det er lov å gjøre feil uten at noen skal få skylden for det. Går noe galt, er det prosessene eller teknologien vi retter oppmerksomheten mot, ikke enkeltpersoner. Dessuten deler vi feilene våre for å lære av dem. Da kan vi unngå at andre gjør samme feil, og vi ufarliggjør det hele, sier Avesh.

DNB-hovedkontoret i Bjørvika i Oslo.  <i>Foto:  TUM Studio</i>
DNB-hovedkontoret i Bjørvika i Oslo.  Foto:  TUM Studio

Innovasjon krever mot til å ta grep som ikke alltid lykkes. Men også redskaper som bidrar til å redusere konsekvensene av feil som oppstår underveis.

– Blant annet har vi laget dashboard der alle kan se kritiske parametre i sanntid. Det gir en felles forståelse og et godt beslutningsgrunnlag til å gjøre endringer. Med tanke på at vi har mer enn 100 team i DNB, er dette i seg selv verdifullt, sier Satya.

Med den raske endringstakten følger nye måter å angripe situasjoner på. Delvis handler det om et tettere samarbeid internt, delvis om å ta i bruk nye metoder for å forutse konsekvenser av endringer før de gjøres.

– For to-tre år siden tok vi steget fra en mer tradisjonell måte å jobbe på til devops, der team i større grad jobber sammen om utvikling og drift. Så har det skutt fart med sky, mikrotjenester og så videre. SRE kan sees som den reneste formen for devops. Praksisen ligger til grunn for hvordan vi utvikler, tester, implementerer og drifter tjenester.

Kaosteknikk, AI og prediktiv analyse 

Avesh anslår at DNB i løpet av siste halvannet år har gjort flere endringer av IT-systemene enn de foregående 6-7 årene. Likevel har antallet feil gått ned, særlig etter at SRE ble innført.

–  Først handlet det om å eliminere unødvendig tidsbruk ved automatisering, så om å gi verktøy som ytterligere la til rette for raske responser, og å åpne nye kanaler for samarbeid.

Mange team er fortsatt i startfasen. Men de teamene som var først ute med SRE er nå over i en ny fase der kaosteknikk, AI og prediktiv analyse inngår. Målet er ytterligere optimalisering av ressursbruk og evnen til å gjøre raske endringer.

 Satya N. Sundararajan og Avesh Godase trives godt i Bjørvika. Foto: TUM Studio 
 Satya N. Sundararajan og Avesh Godase trives godt i Bjørvika. Foto: TUM Studio 

– Det er stadig nye verktøy å utforske. Så langt har det vært en spennende reise, sier Avesh.

Han mener at det i fremtiden vil bli et økende behov for fullstack utviklere, nettopp fordi det blir stadig viktigere å se hele bildet.

– Vi brenner for å bygge og forbedre tjenester. Med SRE frigjøres tid til å lære, og til å bli raskere, mer tverrfaglige.

En positiv bivirkning av å bryte ned siloer mellom team og avdelinger er at det også bidrar til et mer allsidig arbeidsmiljø.

– Folk fra IT og forretningssiden møtes i større grad enn før. Jeg har fått nye venner i både DNB Markets og i shipping. Det at vi jobber på tvers av tradisjonelle skillelinjer er med å skape trivsel på arbeidsplassen. Teknologien gir det sosiale et løft, avslutter Avesh.

Les flere artikler fra DNB