Slik gikk det til da NetCom falt ut

12. juni mistet 70.000 NetCom-brukere summetonen. Årsakskjeden bekrefter loven om tingenes iboende faenskap.

WM-data hadde frokostseminar om norske bedrifters forhold til nedetid i dag. En av de første innlederne var NetCom-direktør for utbygging og produksjon, Dag Kleivan. Han fikk direkte erfaring med nedetid 12. juni i år, da 70.000 NetCom-abonnenter i Oslo og Bærum var uten dekning, blant dem Aftenposten der man nylig hadde innført "trådløs bedrift", og Oslo Taxi.

    Les også:

– De 70.000 utgjør 6 prosent av våre kunder, presiserte Kleivan. – De var uten dekning fra kl 0514 til kl 1225. I tillegg falt alle IP-tjenestene våre ut fra kl 0514 til kl 0850. Men det var lite merkbart.

Kleivan fortalte historien i stor detalj. Den viser, nok en gang, hvor galt det kan gå når ting først begynner å sette seg på tverke.

– Kvelden før hadde det vært en serie med kraftige lokale regnskyll i Oslo-området. Ett av disse kom over et bygg med et av våre seks svitsje sentre.

Dette bygget var konstruert med et innvendig taknedløp som sprang lekk. Taknedløpet gikk langs et innvendig og normalt absolutt vanntett bygg med likerettere som forsyner svitsjeenhetene med strøm. Akkurat den kvelden hadde montører som drev utbedringsarbeid, boret et lite hull i en vegg for å trekke en midlertidig kabel. Vann dryppet fra en bend i taknedløpet og kom seg inn i likeretterbygget.

– Vannet slo først ut et alarmkort. Etter hvert falt likeretterne ut etter tur. Batteriene slo inn automatisk og holdt svitsjesenteret i gang. På morgenkvisten ble de utladet, og utstyret begynte å feile. Kl 0514 mistet vi all funksjonalitet, og klokka 0515 ble det gitt full varsel om rød beredskap, det øverste nivået. Tre beredskapsenheter var i gang 40 minutter etter at alarmen gikk, ett på Risløkka der svitsjesenteret er, ett i Trondheim, og ett i Nydalen i Oslo der ledelsen holder til. Fram til 0930 greide vi å reparere likeretterne og begynte å lade batteriene. Deretter tok det den tiden det måtte å gjenopprette tjenesten.

Kleivan oppsummerer at den tekniske problemløsningen virket meget bra. På andre områder er det gjennomført viktige endringer. For eksempel måtte rutinene for å mobilere kriseteamet forbedres, siden noen ikke hadde dekning da vi falt ut.

– Jeg har alltid tilgjengelig et SIM-kort fra en konkurrerende operatør, slik at jeg alltid er sikker på å ha dekning, sa Kleivan. Han er sjef for kriseteamet.

Andre endringer gjelder rutiner for informasjonsarbeidet.

– Det ble tidlig skapt et inntrykk i media om at svikten ble utløst av flom. Når slike inntrykk skapes, har de lett for å feste seg.

Dessuten er det gjennomført endringer i det Kleivan kaller den tekniske verdikjeden, for å gjøre den sikrere og mer robust. Blant annet er nettverkets stjernestruktur justert slik at det lar seg gjøre å rute om trafikken dersom et svitsjesenter faller ut.

– Vi holder ved vår operasjonelle filosofi der vi satser på desentralisering og redundans framfor atombombesikre fjellhaller. Vi har i dag et spredt og sikkert nett, blant annet fordi enheter kan ta over for hverandre. Vi utfører et systematisk arbeid for å sikre at vi alltid vet hva som skjer i systemet. Ett driftssenter overvåker alt.

Til toppen