Domino avskaffer døgnkontinuerlig bemanning hos NASA

NASA har ikke lenger råd til døgnbemannet satellittovervåkning. - Et enkelt Domino-basert system sørger for at mannskap tilkalles under kriser, og sparer seks millioner dollar i året, forteller prosjektansvarlige Jeff Fox.

NASA har ikke lenger råd til døgnbemannet satellittovervåkning. - Et enkelt Domino-basert system sørger for at mannskap tilkalles under kriser, og sparer seks millioner dollar i året, forteller prosjektansvarlige Jeff Fox.

Jeff Fox arbeider for det halvoffentlige laboratoriet Pacific Northwest National Research Lab. Han og Mick Baitinger fra Nexgen Solutions fikk oppdraget da USAs romfartsorganisasjon NASA skulle implementere sparepålegget "faster, better, cheaper" på mannskapet som fulgte med satellittene døgnet rundt. I stedet for døgnkontinuerlig treskifts system skulle de over på vanlig dagtid.

- Det var ingen triviell overgang, forklarer Keith Walyus fra oppdragsgiveren NASA. Walyus har ansvar for den daglige driften av romteleskopet Hubble.

- Siden Hubble ble skutt opp i april 1990 har vi registrert over 7000 ulike uregelmessigheter som vi har måttet rette opp fra jorda. Hubble brukes døgnet rundt av forskere verden over, og vi kan ikke tillate at små uregelmessigheter hindrer menneskeheten fra å utnytte instrumentet fullt ut.

Oppdraget til Fox og Baitinger gikk følgelig ut på å lage et system som oppfatter når det skjer feil, hva slags feil det dreier seg om, hva slags folk er best til å rette på den - og gå gjennom beredskapslisten for å varsle den som mest sannsynlig kan rette opp uregelmessigheten så raskt som mulig.

- Dette kan ikke løses ved en enkel alarmtjeneste, understreker Walyus.

- Siden tiden er så avgjørende, må systemet også la mannskapet rette på feil over Internett fra en hvilken som helst terminal. At vi skal spare penger, betyr ikke at vi kan tillate oss å feile. En annen viktig forutsetning er at driftspersonellet ikke skal bruke mesteparten av sin tid på feilretting, men på normale driftsoppgaver som å planlegge og utføre oppdragene de er pålagt av forskerne. Derfor må grensesnittet og bruken være så enkel som mulig.

Systemet som Fox og Baitinger snekret sammen, er døpt SERS for "space emergency response system". SERS er blitt en integrert del av satellittdriften hos NASA.

Les digi.nos øvrige dekning fra Lotusphere i Orlando:


US Navy oppdager Domino-replikeringens velsignelse
CIA-tips bedret sikkerheten i Notes
Øyeblikksmeldinger integreres i Notes-klienten
Tre typer klienter for Notes
8,5 millioner nye Notes-brukere i fjerde kvartal
Raven lansert i Orlando
Et vell av produktnyheter fra Lotus

Før SERS, krevde NASAs rutiner at feil og feiloppretting skulle rapporteres på papir. Rapportene fra tusener av feil over mange år fra Hubble ble etter hvert lagret i kartonger utenfor Walyus' kontor. Da var det ikke så enkelt å systematisere erfaringene.

- SERS styres gjennom en nettleser, forteller Baitinger. - En vanlig tjener kan kjøre SERS for opptil seks ulike satellitter. Informasjon er lagret i rundt femten databaser. Det er ellers en rekke agenter, samt grensesnitt mot personsøkere og telefoni, smarte filtre for loggfiler, skripter, C++ kode, og til og med shareware-programmer. Databasene replikeres kontinuerlig, og det er også innebygget alternativer i tilfelle noen av kommunikasjonslinjene skulle feile.

Den kontinuerlige meldingsstrømmen fra satellittene samles i egne loggfiler i det NASA betegner som de "operative" datamaskinene. Loggfilene overføres per FTP til SERS-systemet på utsiden av brannmuren. Her granskes loggen automatisk. Ved feil genereres e-post-meldinger i et eget spesialisert format til selve responssystemet. Baitinger tenker seg et ekspertsystem på innsiden av brannmuren som et alternativ. Ifølge Fox vil dette ekspertsystemet døpes SmartERS.

- Loggfilene overføres etter en fast plan. En forsinkelse i forhold til denne planen er en uregelmessighet som utløser et eget varsel til SERS. Ved alle uregelmessigheter rapporterer SERS til ulike skjemaer i databasen tilpasset den pålagte arbeidsflyten i feilrettingsrutinene.

Når systemet har funnet fram til hvilken feilretter som er best ut fra kompetanse og tilgjengelighet, sendes en melding som beskriver den aktuelle feilen så presist som mulig. I dag brukes tekst til personsøker og kunstig tale til telefon. Mottak må kvitteres for, og det må bekreftes om man tar på seg ansvaret eller ikke. Hvis man ikke svarer innen en halvtime, eller hvis man melder at man ikke kan ta på seg ansvaret, søker systemet nestemann på beredskapslisten.

- Web-grensesnittet bidrar til å gjøre systemet enkelt å bruke. Det ideelle hadde vært at feilrettingen kunne gå over den samme terminalen som varslingen. Det er bare snakk om tid før vi har en løsning for trådløse IP-terminaler som Palm, sier Baitinger.

- Men inntil videre må du motta en melding og så finne en PC for å rette opp feilen, legger han til.

Et problem som ikke kunne løses bare med Domino-verktøyet, og som forklarer hvorfor utviklerne måtte ty til både skripter og C++ kode, er at SERS krever agenter som kjøres hvert minutt, for å få til et så tilnærmet sanntidssystem som mulig. Agentene i Domino kan ellers ikke kjøres hyppigere enn hver halvtime.

- SERS kjøres i dag på Domino R4, presiserer Fox.

- Vi kommer til å oppgradere systemet til R5 med det første, og vi vil også dra nytte av "Mobile Services for Domino". Dessuten vil vi legge inn funksjonalitet fra [Lotus' tjeneste for øyeblikkelige meldinger] Sametime.

Selskapet Global Science and Technology har også bidratt til prosjektet, sammen med Pacific Northwest National Research Lab og Nexgen Solutions.

Til toppen