Rapport tar livet av enda flere harddisk-myter

Enda en studie av harddisk-levetid er nylig blitt publisert. Den kommer med nye avsløringer.

digi.no skrev tidligere denne uken om en rapport Google har publisert om selskapets erfaringer med harddisker og levetid.

    Les også:

Men Google er ikke alene om å gjøre slike studier. Bianca Schroeder og Garth A. Gibson, tilknyttet Carnegie Mellon Universitys Computer Science Department har nylig utgitt en oppsiktsvekkende rapport med navnet "Disk Failures in the Real World: What Does an MTTF of 1,000,000 Hours Mean to You?".

Undersøkelsen er basert på data om levetiden til omtrent 100.000 harddisker fra minst fire leverandører. Det er snakk om harddisker med enten SCSI-, FC- eller SATA-grensesnitt.

Den første myten som en gang for alle slås ihjel, noe som for mange ikke kommer som en overraskelse, er at det er en klar sammenheng mellom MTTF-verdien (Mean Time To Failure) som oppgis fra harddiskleverandørene, og den årlige utskiftingsraten av harddiskene på grunn av feil.

Harddiskene som er med i undersøkelsen skal MTTF-verdien har vært på mellom 1 til 1,5 millioner timer. Dette tilsvarer en nominell årlig feilrate på 0,88 prosent.

Men undersøkelsen viser at den faktiske årlige utskiftingsrate typisk er på mer enn 1 prosent. 2 til 4 prosent er vanlig og i noen systemer er den så høy som 13 prosent.

Man har også funnet bevis for at feilraten ikke er konstant i forhold til alder. Man har tidligere antatt at utskiftingsraten over tid har fulgt en badekarkurve, hvor den er er høy fra starten av, men synker raskt det første året, og deretter er raskt voksende fra og med det femte året. Fem år er blitt ansett som den nominelle levetiden på harddisker. Undersøkelsen viser at utskiftingsraten faktisk stiger kontinuerlig fra så tidlig som det andre driftsåret. Og dette på grunn av slitasje, ikke "spebarnsdødelighet".

Ut fra datasettene har man ikke kunnet se at erstatningsratene for SATA-harddisker er høyere enn de tilsvarende ratene for SCSI- eller FC-disker.

Man mener at faktorer som er uavhengig av harddiskene, slik som bruksområder og operasjonsmiljøet, kan påvirke erstatningsratene i større grad enn komponentspesifikke faktorer. SATA-disker brukes i lang større grad i vanlige PC-er og mindre servere enn det SCSI- og FC-harddisker gjør.

En faktor som blant annet påvirker RAID-baserte harddisksystemer, er at den forventede, gjenstående tiden fra en harddisk må erstattes og til den neste harddisken må erstattes, vokser etter med tiden som har gått siden den første utskiftingen.

Dette betyr at dersom en harddisk i et harddisksystem må skiftes ut, er faren for at en annen harddisk i det samme systemet vil feile, størst i tiden rett etter at den første harddisken har feilet. Dermed er det ikke usannsynlig at to harddisker i det samme systemet kan feile omtrent samtidig.

Les hele rapporten her.

Til toppen