OpenPower og IBM Power9

Lynrask kobling mellom CPU og GPU skal gjøre Power9 til datasenternes AI-arbeidshest 

OpenPower-alliansen har vokst fra 5 til 340 selskaper. Nå er IBMs andre OpenPower-prosessor lansert i Norge.

IBM-ingeniør Stefanie Chiras sitter sentralt på utvikling av Power-arkitekturen. Her viser hun frem den nye prosessoren.
IBM-ingeniør Stefanie Chiras sitter sentralt på utvikling av Power-arkitekturen. Her viser hun frem den nye prosessoren. (Foto: Jack Plunkett/Feature Photo Service for IBM)
EKSTRA

OpenPower-alliansen har vokst fra 5 til 340 selskaper. Nå er IBMs andre OpenPower-prosessor lansert i Norge.

Hei, dette er en Ekstra-sak som noen har delt med deg.
Lyst til å lese mer? Få fri tilgang for kun 199,- i måneden.
Bli Ekstra-abonnent »

Med unntak av ARM er det ikke mange alternativer til x86-arkitekturen igjen. Mange tenkte antagelig at det var begynnelsen på slutten for IBMs Power-prosessorer da IBM høsten 2013 annonserte at de ikke lenger skulle videreutvikle Power-prosessoren alene, men «gi den bort». CPU-designet ble gjort til en åpen arkitektur som andre kan lisensiere – på samme måte som ARM gjør. Men frykten er blitt gjort til skamme – i dag er hele 340 selskaper med i den såkalte OpenPower-alliansen, sammen med blant andre Google og Nvidia.

IBM Power 9.
IBM Power 9. Foto: IBM

Støtte for Nvidias NVLink-buss som gir svært høy overføringshastighet mellom GPU og CPU er blant de viktigste nyhetene i den nye Power9-prosessoren. Dette er en løsning som kan ha stor betydning for GPU-intensive bruksområder, for eksempel innenfor kunstig intelligens. Vi skal komme nærmere inn på hvorfor litt senere i artikkelen.

På et arrangement i Oslo denne uken hvor IBM offisielt lanserte den nye Power9-prosessoren for det norske markedet, kunne nordisk Power- og stormaskinsjef Stefan Falkensteen i IBM forsikre de fremmøtte om at Power-arkitekturen lever i beste velgående. 

— Dette er en fantastisk brikke som det har tatt oss mange år å utvikle. Det er en helt ny brikke, hvor vi har redesignet hver av kjernene i brikken, sa Falkensteen.

Power9-prosessorene brukes nå i superdatamaskinen Summit ved det amerikanske energidepartementets forskningssenter Oak Ridge National Laboratory, samt i superdatamaskinen Sierra. Når Summit er ferdig vil den antagelig toppe listen over verdens kraftigste superdatamaskiner.

Ifølge IBMs egne målinger skal en maskin med Power9-brikken gjøre det mulig å trene maskinlæringsmodeller nesten fire ganger raskere enn en tilsvarende maskin basert på Intels Xeon-prosessorer. 

Dette er OpenPower 

Den nye Power9-prosessoren er basert på Power-arkitekturen, som er en RISC-basert CPU-arkitektur som har blitt brukt i både IBM-prosessorer og i prosessorer fra andre aktører. Arkitekturen ble først brukt i RS/6000-maskinene fra IBM på 90-tallet. På begynnelsen av 90-tallet gikk også Apple, IBM og Motorola (AIM Alliance) sammen om å utvikle en prosessor for PC-markedet, og en variant av Power-arkitekturen kalt PowerPC. PowerPC-prosessorer ble brukt blant annet i Apple-datamaskiner helt frem til 2006, før de gikk over til Intels x86-prosessorer. På det tidspunktet utviklet både IBM og Motorola PowerPC-prosessorer, uavhengig av hverandre. Arkitekturen har også blitt brukt i Cell-prosessoren som satt i Sonys Playstation 3. 

Det er imidlertid IBM Power-prosessorene vi skal fokusere på i denne artikkelen. Dette er avanserte prosessorer beregnet på IBMs servere og stormaskiner, og prosessorer vi stort sett finner i datasentere. Her i Norge vil blant annet Basefarm implementere Power9 i sine datasentere. 

Power9 er andre generasjon prosessor som er basert på OpenPower. Den første – IBM Power8 – ble annonsert i 2013 og kom på markedet året etter.

Hva er så bakgrunnen for OpenPower – og hvorfor valgte IBM å åpne opp sin CPU-arkitektur?

Stefan Falkensteen, nordisk Power- og stormaskinsjef i IBM, under lanseringen i Oslo i april 2018. Foto: Kurt Lekanger

Stefan Falkensteen fortalte at Google i 2013 banket på døren til IBM og sa de var interessert i Power-arkitekturen. 

– Google foreslo at vi skulle åpne opp arkitekturen. Fordelen ville være at vi kunne få andre selskaper til å bygge sine løsninger til vår arkitektur, sa Falkensteen.

I starten var det kun IBM, Tyan, Mellanox, Nvidia og Google som var med i alliansen.

– Vi startet som fem selskaper, i dag er vi mer enn 340. 

Falkensteen forteller at det var helt nødvendig for IBM å åpne opp arkitekturen på grunn av økonomi og skalerbarhet.

– Hvis du skal lage én brikke – en generasjon, koster det faktisk 3 milliarder dollar. Det  er mye penger. Vi må forsikre oss om at vi får mange enheter ut på markedet. Hvis det er på kun noen få områder, vil vi ikke ha volum og det vil ikke være økonomi i å produsere dem. Derfor må vi forsikre oss om at vi får produktene ut på markedet.

OpenPower-alliansen jobber i tillegg til selve Power-arkitekturen også med maskinvare- og programvareløsninger på et bredere plan – med mål om å gjøre bransjen i stand til å designe enda bedre løsninger for datasentere. Dette går på alt fra brikkedesign og systemdesign, til åpen kildekodebaserte programvareløsninger for Power-systemer.

Power 9 med egen motorvei til Nvidia-GPU-er

Den første OpenPower-brikken – Power8 – som kom i 2013 ble bygget med 22 nanometers produksjonsteknologi og kunne utstyres med opptil 12 kjerner. Sammenlignet med den gamle Power7-prosessoren skulle ytelsen ved kjøring av én enkelt tråd være 1,6 ganger høyere. Og i andre sammenhenger kunne ytelsen være mellom 100 og 200 prosent, ifølge tall IBM viste til ved Power8-lanseringen.

Mikroskop-bilde av Power9-brikken. Foto: IBM

Den nye Power9-prosessoren er bygget med en 14 nanometer produksjonsprosess fra halvlederprodusenten GlobalFoundries, og det er gjort en rekke endringer i designet for å gjøre den enda bedre egnet til de oppgavene som er spesielt krevende i dagens datasentere. Her legger IBM spesielt vekt på maskinlæring og kunstig intelligens.

– Vi snakker om «strong AI», det er den typen AI som kan ta over sofistikerte jobber, sier Jonas Ullberg, direktør for kognitive løsninger i IBM Europa. Med dette mener han kunstig intelligens på et avansert nivå, hvor maskinlæring kan erstatte for eksempel regnskapsførere.

Ullberg forteller at innenfor maskinlæring så brukes det meste av tiden til en datamaskin til å trene maskinlæringsmodellene med store mengder data. Det å korte ned tiden det tar å trene modellene er viktig.

Innenfor både AI og kryptomining bruker man i stor grad GPU-er (grafikkprosessorer) til å gjøre beregninger, ettersom det har vist seg at GPU-er er mer effektive enn CPU-er på denne typen oppgaver. Det benyttes også FPGA-er (field-programmable gate array), altså brikker som kan programmeres til ulike oppgaver. 

  Foto: IBM

Dette betyr at all prosessering ikke lenger skjer i én enkelt brikke (i en mikroprosessor), men at dette er fordelt på mange ulike brikker i et datasystem (CPU-er og GPU-er). Da trengs det høy båndbredde mellom de ulike brikkene. Siden det er CPU-en som forer GPU-ene med data trengs det høy båndbredde også her – ikke bare mellom GPU-ene. 

Det er her Nvidia NVLink kommer inn i bildet. Power9-prosessoren har nemlig i tillegg til PCIe 4.0 også støtte for NVLink 2.0, som er en løsning som gir høyere overføringshastigheter mellom to eller flere GPU-er og CPU-er. Foreløpig er det Power9 den eneste CPU-en som støtter NVLink.

  Foto: Nvidia

– Intel-systemer har en kobling mellom GPU og GPU. Vi har en tilkobling mellom GPU og CPU med NVLink. Det forbedrer ytelsen ved trening av nevrale nettverk, sier Ullberg .

Den nyeste versjonen av NVLink (2.0) som er bygget inn i Power9 støtter overføringshastigheter på opptil 300 gigabyte i sekundet (25 GByte/s per kanal). 

Det er flere versjoner av Power9: En såkalt scale-out-variant som er beregnet på servere med to CPU-sokler, og en scale-up-variant beregnet på servere med fire eller opp til 16 CPU-sokler. Prosessorene fås med fra 12 til 24 kjerner, som kan være av to ulike typer; SMT4 og SMT8. Hovedforskjellen er at hver SMT4-kjerne kan kjøre fire tråder samtidig, mot åtte på SMT8. 

Fire ulike varianter av Power9-prosessoren. Illustrasjon: IBM

Operativsystemer som støttes på Power9 er AIX, IBM i og Linux. 

– Dette kan du gjøre samtidig. Du kan kjøre en database som kjører AIX i en logisk partisjon, Linux i en annen partisjon og IBM i i en tredje partisjon – samtidig, sier Falkensteen.

Løsningen fungerer ved hjelp av IBMs virtualiseringsteknologi PowerVM, som lar deg partisjonere serveren. Falkensteen forteller at denne løsningen er attraktivt for de som vil kjøre SAP på AIX, men i tillegg også vil kjøre SAP HANA – som finnes bare for Linux, ikke AIX. Da kan man altså kjøre Linux samtidig som AIX på samme server.

Når det gjelder ytelse så viser IBM til SAPs egen benchmark – SAPS (SAP Application Performance Standard). Ifølge IBMs tall har Intel Skylake en ytelse på 2600 SAPS per kjerne, Power8 er på 5300 SAPS/kjerne, mens Power9 klarer 7400 SAPS/kjerne. 

Ny Power9-basert server for datasentere

Selv om den offisielle norgeslanseringen av Power9 ble gjennomført nå i april, ble de første detaljene om den nye prosessoren annonsert allerede i august 2016. I desember i fjor annonserte selskapet en ny server basert på den nye prosessoren, og denne serveren ble også annonsert for norske kunder og partnere på arrangementet i Oslo denne uken.

Navnet på den nye serveren er IBM Power Systems AC922. Den er beregnet på datasentere, med fokus på krevende bruksområder hvor det trengs mye datakraft – som innenfor kunstig intelligens og maskinlæring. Ifølge IBM skal serveren tilby 9,5 ganger så mye I/O-båndbredde som x86-alternativer, 2,6 ganger så mye RAM, 1,8 ganger høyere minnebåndbredde og dobbelt så høy ytelse per kjerne sammenlignet med x86. 

IBMs Power9-baserte AC922-server. Foto: IBM

Den nye serveren kommer med PCI Express (PCIe) 4.0, som dobler båndbredden per PCI-bane sammenlignet med PCIe 3.0. Vi snakker om en hastighet på 16 gigatransfers per sekund (GT/s), som betyr at ett PCIe 4.0-spor med 16 baner kan overføre rundt 64 gigabyte per sekund. Serveren støtter også OpenCAPI 3.0, som er et grensesnitt mellom Power-prosessoren og andre komponenter, som minne, nettverk, lagring og for eksempel FGPA-akselleratorer.

AC922 har to Power9-brikker og fra to til seks Nvidia Tesla V100-grafikkprosessorer (GPU-er). 

Det er snakk om en såkalt «scale-out»-server, som betyr at man øker ytelsen ved å legge til flere servere (med få prosessorer og mindre RAM i hver server), fremfor å legge til flere prosessorer og mer RAM i hver server. 

For øyeblikket er det kun IBM som har servere basert på den nye Power9-prosessoren, men den Taiwanesiske produsenten Tyan har allerede en Power8-server, og som en av grunnleggerne av OpenPower er det neppe utenkelig at de vil komme med en Power9-basert server etter hvert.

For øvrig har Google bekreftet at de nå kommer til å ta i bruk en Power9-basert plattform kalt Zaius, laget av Rackspace, i sine datasentere. 

Kommentarer (0)

Kommentarer (0)
Til toppen