Kraftsats fra EMC

Øker ytelsen tre til seks ganger.

Kraftsats fra EMC
EMCs nye VNX kommer i flere størrelser. Den største er ikke avbildet: Den er like stor som de to nest største til sammen. Alle unntatt den minste er umiddelbart tilgjengelig. Bilde: EMC

I forrige uke gjorde EMC en av de største lanseringene i sin historie. Den sentrale nyheten er neste generasjon av lagringsfamilien VNX, beregnet på midtsjiktet.

De nye VNX-systemene er tilført flere tekniske forbedringer som til sammen gir langt bedre ytelse: Fire ganger så høy SPECsfs (580 796 nfs Ops/Sec), over tre ganger så høy ytelse for transaksjonelle NAS-applikasjoner (for eksempel VMware over NFS), og fire ganger flere samtidige OLTP IOPS (735 000 målt med både Oracle og SQL).

EMC påstår videre at de nye VNX-systemene kan støtte over seks ganger så mange virtuelle maskiner enn forrige generasjon, det vil si over 6 600. Datavarehus under Oracle eller SQL får dataoverføring i opptil 30 gigabyte per sekund, tre ganger så mange som forrige generasjon.

– Kapasiteten er økt til opptil 6 petabyte i den største varianten. Ytelsen skal kunne komme opp i 1,1 millioner IOPS. Varianten i 3 U høyde skal kunne levere opptil 200 000 IOPS, sier seniorteknolog Jørn Malsten i EMC Norge.

VNX8000, toppmodellen.
VNX8000, toppmodellen. Bilde: EMC, George Disario

Malsten forklarer at det vesentlige av forbedringene innen ytelse og kapasitet kommer av noen få teknologiske nyvinninger.

– Magnetiske disker er i ferd med å nå et metningspunkt. Utviklingen her gir ikke lenger muligheter for vesentlige forbedringer innen ytelse eller kapasitet. Derfor må vi satse på andre ting.

I hovedsak dreier det seg om følgende:

  • Mer gjennomtenkt og mer allsidig bruk av flashminne i form av såkalte SSD-er (solid state disks)
  • Innføring av en ny type høykapasitets SSD, kalt eMLC for «enterprise multilevel chip»
  • Optimalisering av kontrollere og systemprogramvare for å utnytte Intels nyeste prosessorteknologi, blant annet for å sikre lineær skalerbarhet med opptil 32 prosessorkjerner
  • Tilrettelegging for tredje generasjon PCI-e
  • Ny løsning for blokkdeduplisering

– Tidligere håndterte vi SSD som en form for disk. I nye VNX er det optimalisert med tanke på flash. Før greide vi ikke å utnytte kjernene i prosessorene godt nok. Nå er systemet skrevet om slik at all last fordeles på alle kjerner, sier Malsten.

Tilpasningen til Intels flerkjerneteknologi er døpt MCx.

EMC sier MCx sikrer dynamisk fordeling av oppgaver, i motsetning til den tidligere statiske fordelingen. Med statisk fordeling kan én kjerne utnyttes 100 prosent, men for de øvrige er utnyttelsen fra 50 prosent og nedover. Jo flere kjerner, desto dårligere gjennomsnittlig ytelse per kjerne. Med MCx’ dynamiske fordeling kan snittutnyttelsen av samtlige kjerner – opptil 32 – ligge på opptil 80 prosent.

VNX 5600
VNX 5600 Bilde: EMC, George Disario

MCx utnyttes på flere områder i de nye VNX-systemene:

  • Innen DRAM-cache har MCx gjort det mulig å avskaffe partisjoneringen mellom skrive- og leseoperasjoner. Den delte cachen administreres automatisk: Den innstiller seg selv svært raskt, og det er ingen brukerdefinerbare innstillinger.
  • For å supplere DRAM-cache bruker VNX en annen type mellomlagring av lese- og skriveoperasjoner som EMC kaller FAST cache. Her utnyttes SSD-disker til mellomlagring. Avhengig av VNX-modell kan fra opptil 500 gigabyte (med SSD-er på 100 gigabyte hver) til 4,2 terabyte (med SSD-er på 200 gigabyte hver). Det brukes SSD av typen SLC (single level chip). Regelverket for caching er endret for å gi kjappere «førstegangs oppvarming»: Ett treff er nok til å sende en datablokk til mellomlageret. Først når mellomlageret er 80 prosent full endres regelen slik at nye blokker trenger tre treff for å havne der. Ved oppstart av for eksempel store VDI-miljøer skal denne løsningen komme spesielt godt med.
  • MCx utnyttes også til såkalt «multicore RAID»: En følge er at man kan fysisk flytte disker innen det samme VNX-systemet. Disker kan flyttes mellom diskhyller og busser og fart. Poenget er muligheten for manuell inngripen ved balansering av last.

SSD-disker brukes ikke bare til mellomlager: VNX utnytter dem også til øverste nivå i såkalt «tiering», det vil si lagdelt lagring.

Poenget er at raske lagringsmedier er dyre og har lav kapasitet, mens trege lagringsmedier er rimelige samtidig som de har stor kapasitet. Ideen er da at data som brukes ofte havner på raske lagringsmedier, mens data som brukes sjelden henvises til trege lagringsmedier.

Tieringen i VNX er endret på to måter. Granulariteten er bedret ved at den minste flyttbare datamengden er redusert til 256 megabyte. Nivået med SSD-disker støtter nå eMLC-disker. «E» i eMLC antyder den vesentlige forskjellen mellom eMLC (for «enterprise») og MLC for pc-er: Data lagres i flere nivåer (ML står for «multilevel»), men med vesentlig bedre pålitelighet og tilpasset den langt mer intense bruken som skjer i bedrifters lagringssystemer. Sammenliknet med SSL er eMLC rimeligere og har større kapasitet.

Fra tredje kvartal vil tieringen i VNX kunne omfatte SSD i 100 og 200 gigabyte, SAS-disker i 15 000 omdreininger per minutt på 300 og 600 gigabyte, og NL-SAS-disker i 7 200 omdreininger per minutt i 2, 3 og 4 terabyte.

MCx ligger også til grunn for en mer hensiktsmessig løsning for katastrofeberedskap når data lagres samtidig i fysisk atskilte datasentraler.

Det typiske her er at lagringen i den ene datasentralen er «aktiv» mens den er «passiv» i den andre. Deet vil si at alle oppdateringer går direkte til den «aktive», og at de så kopieres til den «passive». MCx gjør det mulig å erstatte aktiv/passiv med aktiv/aktiv: Katastrofeberedskapen er den sammen, det vil si at den andre datasentralen tar over automatisk om den ene skulle svikte. Fordelen er at man under vanlig drift kan utnytte begge. I stedet for at lagringen i den andre datasentralen er passiv, bidrar den hele tiden på linje med den andre.

Aktiv/aktiv krever at programvare tilpasses spesielt. Oracle RAC («Real Application Clusters») er sertifisert med tanke på EMCs aktiv/aktiv-løsning. I en egen rapport – http://www.emc.com/collateral/analyst-reports/continuous-operations-applications-Continuous Operations for Applications with Multiple Storage Array Access (pdf, 6 sider) går IDC god for at løsningene er så godt integrert at driften ikke kompliseres. EMC venter at også andre leverandører av klyngeløsninger vil innarbeide teknologien.

Prinsippet for deduplisering er enkelt: Data, enten blokk eller fil, skal bare lagres én gang. Hvis to blokker, eller to filer, er identiske, erstattes dubletten med en peker til «originalen».

Blokkdeduplisering har antakelig vært en vrien nøtt å knekke for EMC.

Blokkdeduplisering skjer etter at endringene er skrevet til disk. Den medfører en betydelig økning av ledig kapasitet.
Blokkdeduplisering skjer etter at endringene er skrevet til disk. Den medfører en betydelig økning av ledig kapasitet. Bilde: EMC

– Vi fryktet at det ville gi dårligere ytelse, sier Malsten. – Det skjedde ikke.

Løsningen går ut på å skrive blokken til disk først, og så deduplisere. Hvis blokken finnes i systemet fra før, erstattes den av en peker. Granulariteten i VNX-dedupliseringen er 8 kilobyte.

Tiering betyr at man kan halvere det totale antallet disker i forhold til tidligere «monolittiske» løsninger (der alle disker er like). Blokkdedupliseringen gjør at også antall disker i tieringen kan halveres. De tre eksemplene nedenfor har tilsvarende ytelse og kapasitet.

Tiering halverer antall disker, deduplisering kan ytterligere halvere hvor mye plass lagringssystemet krever.
Tiering halverer antall disker, deduplisering kan ytterligere halvere hvor mye plass lagringssystemet krever. Bilde: EMC

Ellers er EMCs administrasjonspakke Unilever Management Suite oppgradert med tanke på forvaltning av både blokk og fil, samt sentral administrasjon av VNX og XtremSF (EMCs PCI-e-kort med flash for servere).

Til slutt kan nevnes at EMC innfører en ny oppgraderingsordning som gjør det rimeligere å oppgradere fra et VNX-system til et større.