Rask analyse av samtidige datastrømmer

IBM System S skal levere analyse i sanntid av datastrømmer fra alt fra sensorer til XML og video.

Rask analyse av samtidige datastrømmer

System S er et IBM-prosjekt innen «stream computing»: Det skal være i stand til å levere analyse i tilnærmet sanntid av flere datastrømmer samtidig fra mange ulike kilder: Tekst, XML, sensorer, lyd, bilde, video og så videre.

Det er mange bruksområder for denne typen systemer. Det som nevnes hyppigst er overvåking – gjenkjenning av katastrofesituasjoner, av individer, av gjenstander, av nettrafikk og så videre – og finans – der automatisk avgjørelser om kjøp må tas og gjennomføres på en brøkdel av et sekund.

«Stream computing» er i vinden: Googles kjøp av PeakStream for to uker siden var motivert av et behov for løpende analyse av video.

IBM beskriver System S som distribuert mellomvare for å grave i datastrømmer («distributed stream-mining middleware»). Mellomvaren er beregnet på å støtte applikasjoner som henter sine inndata fra datastrømmer, og som også leverer sine utdata som datastrømmer.

Det er med andre ord ikke snakk om at IBM nødvendigvis skal levere selve applikasjonene. Det viktigste i System S er mellomvaren «Stream Processing Core» (SPC). Denne skal bære applikasjonene over heterogen maskinvare, og forvalte forbindelser, ressurser og dataflyt. IBM bruker denne plansjen for å skjematisere hva SPC er ment å gjøre:

De grønne sirklene med piler mellom representerer dataflytskjemaet til en applikasjon som løpende skal forholde seg til mange samtidige datastrømmer. For hvert trinn i dataprosesseringen, blir stadig mer irrelevant data forkastet, og bare det som teller, når fram til brukerne. Disse kan forholde seg til dataene med én gang, eller legge dem i datavarehus.

IBM har laget en demonstrasjon av System S, som ifølge forhåndsomtalen i Wall Street Journal kjører på en klynge med 800 prosessorer. Denne demonstrasjonen skulle vises til en utvalgt gruppe IT-sjefer i finansverden tirsdag 19. juni.