Microsoft sliter med å holde blant annet Outlook.com-tjenesten tilgjengelig.

Microsofts datasenter ble for varmt

Forklarer 16 timers nedetid for Hotmail.com og Outlook.com.

Driftsavbruddet som tirsdag kveld rammet flere av Microsoft nettjenester, i første rekke e-posttjenestene Outlook.com og Hotmail.com, men også til en viss grad deler av filtjenesten SkyDrive, varte i mer enn 16 timer. Dette er svært lenge i en slik sammenheng. Microsoft tilbyr ingen garantier om oppetid til disse gratistjenestene. Men tilgjengeligheten av slike tjenester forteller likevel mye om en leverandørs evne til å tilby tjenester med nettopp høy tilgjengelighet. Selv en helt ordinær oppetidsgaranti, 99,9 prosent tilgjengelighet, tillater ikke mer enn knapt ni timer nedetid i året.

Dette er forøvrig ikke den første nedetiden til Outlook.com i år. Det har i alle fall vært to tilfeller til som har vart lenge nok til at brukerne har begynt å klage. Men disse har ikke vært like omfattende som avbruddet som skjedde denne uken.

Microsoft har nå kommet med en forklaring på hvorfor det kunne gå så galt. Selskapets Outlook.com-tjeneste er relativt fersk, og svært mange brukere flytter nå over dit fra den gamle Hotmail.com-tjenesten.

Ifølge Microsoft er ikke den store flyttingen av brukere som er den direkte årsaken til nedetiden. Det som var den direkte årsaken til nedetiden var en oppdatering av fastvaren til en sentral del av selskapets fysiske komponenter i ett av Microsofts datasentre.

Det er ikke første gang selskapet har gjort en slik oppdatering, men denne gangen gikk det galt. Av en eller annen grunn førte oppdateringen til en rask og betydelig temperaturøkning i datasentret. Før man rakk å gjøre noe med dette, ble sikkerhetstiltak skrudd på i et stort antall servere ved datasenteret.

Disse sikkerhetstiltakene hindret tilgang til postboksene på disse serverne, men hindret også at andre deler av infrastrukturen kunne utføre automatisk «failover», noe som skulle ha sikret fortsatt tilgang. Dette området i datasenteret huser deler infrastrukturen til Hotmail.com, Outlook.com og SkyDrive.

I forklaringen skriver Microsoft at det ikke var mulig å løse problemet ved hjelp av infrastruktur-programvaren alene, men at det også var nødvendig med menneskelig innblanding.

– Behovet for menneskelig intervensjon er ikke normen for våre tjenester og gjorde at utbedringen tok mye lenger tid, skriver Microsoft.

Microsoft beklager overfor brukerne og lover å gjøre alt for at dette ikke skjer igjen.

    Les også:

Til toppen