BEDRIFTSTEKNOLOGI

- Verste nedetid på over fire år

Facebook forklarer hva som gikk galt.

24. sep. 2010 - 08:44

Facebook har opparbeidet seg et relativt godt rykte når det gjelder oppetid. I hvert fall med tanke på at en halv milliard mennesker jevnlig logger seg på.

Vel opplevde de et harddisk-havari for halvannet år siden, men i hovedsak har det sosiale nettverket holdt seg på beina i lang tid.

Men i går kveld norsk tid gikk det galt.

Beklager

Facebook var nede for telling i to og en halv time. Nettstedet beklager nå hendelsen, som de beskriver som den verste nedetiden de har opplevd på over fire år.

Problemene har bakgrunn i nettstedets system for feilhåndtering. Dette er et helautomatisert system som har i oppgave å verifisere konfigurasjonsverdier i webtjenestens hurtigminne (cache).

Det forklares at hensikten er å erstatte ugyldige verdier i cache fra en originalkonfigurasjon. Problemet oppstod etter at Facebook hadde gjort endringer originalen. Da også originalverdiene ble tolket som ugyldige oppstod en loop.

Overbelastning

Dette førte igjen til en overbelastning med flere hundre tusen databasekall i sekundet. For brukerne resulterte dette i en DNS-feilmelding, eller svært treg tilgang til nettstedet.

Av samme grunn gikk også Facebook sine programmeringsgrensenitt (API-er) og deres «Liker»-knapper ned for telling.

I utbredringsarbeidet måtte Facebook stoppe all trafikk til sin databaseklynge, noe som innebærer at hele nettstedet tas ned.

- Inntil videre har vi skrudd av det berørte systemet som forsøker å endre konfigurasjonsverdier. Vi ser på nye løsninger for hvordan vi kan håndtere dette slik at vi kan håndtere looper bedre.

    Les også:

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.