Illustrasjonsfoto. (Foto: Håkon Jacobsen)

Før stod de krumbøyd i serverracket på universitetet. Nå virtualiserer de så hardt som mulig

En ny tjeneste fra Universitetet i Tromsø skal gjøre det enklere å publisere forskningsdata. UiT Open Research Data ble lansert mandag. Databasen er åpen for deling av forskningsdata for ansatte og studenter ved universitetet slik at forskningen blir mer synlig samt søkbar for alle. 

Det er Universitetsbiblioteket (UB) og IT-avdelingen ved ishavsuniversitetet som står bak løsningen.

Store muligheter

– Databasen er bygd på åpen kildekode ved Harvard og baserer seg på etablerte standarder for hvordan man skal beskrive datasettene. Det gjør at vi har kunnet bygge og aggregere en samlingstjeneste på toppen av databasen. Fordelen med dette er at forskere som er ute etter data ikke må innom institusjonene for å få tak i de, sier leder, Stein Høydalsvik, ved UBs forsknings- og publiseringsstøtte til digi.no.

Ifølge ham gir databasen store muligheter. For eksempel kan fugleinteresserte gå inn og se når trekkfugler er observert i Tromsø de seneste årene. 

Professor ved Tromsø Museum, Robert T. Barrett, har samlet inn data om sjøfugler siden tidlig på 70-tallet som nå følgelig blir offentliggjort som en del av databasen.

Robert Barrett veier lomviunger på Hornøya i juli 2008.
Robert Barrett veier lomviunger på Hornøya i juli 2008. Foto: Adrien Brun

– Det ville være fryktelig synd hvis disse dataene bare havner i et fysisk arkiv i kjelleren her på museet og dermed blir vanskelig tilgjengelig. Andre som kommer etter meg eller er på andre institusjoner kan ha nytte av materialet som jeg har samlet inn, sier Barret til UiT.

– Data er selve grunnsteinen

Poenget med forskning er å drive opplysning og løfte vår forståelse. Grunnsteinen i god forskningspraksis er å bygge på tidligere resultater, forklarer Høydalsvik. Når forskningsdata nå blir delt offentlig vil det gi forskere over hele verden et mye bedre datagrunnlag.

– Delingskulturen i forskerverden er svært viktig, både fordi man bygger videre på resultater som tidligere er oppnådd og fordi forskningen har en egeninteresse av å dele data der det er mulig, konstaterer Høydalsvik.

Driften av den nye Dataverse-databasen står IT-avdelingen ved tromsøuniversitetet for. Dataverse er utviklet ved det amerikanske universitetet og er et stort internasjonalt prosjekt. 

– Vi har så adaptert det til våre behov, og integrert det med en autentiseringsmekanisme som er utviklet av Uninett. Dette er en norsk akademisk autentiseringmekanisme for webtjenester og kan integreres med hva som helst, sier seksjonsleder, Roy Dragseth, for digitale forskningstjenester ved Universitetet i Tromsø til digi.no.

Kjøres på universitetets infrastruktur

Når det kommer til det underliggende systemet kjøres det på universitetets tradisjonelle infrastruktur. Det vil si store VMware-klynger med bakliggende lagring. Universitetet vurderer andre teknologier når det blir mer modent, opplyser Dragseth.

VM-klyngene er skalerbare og man har full redundans da man benytter seg av flere store maskinhaller. Ifølge seksjonslederen har ishavsuniversitetet svært god IT-infrastruktur. 

For ti år siden var det vanlig å se kollegaer stå krumbøyd i ryggen med hodet inn i en terminal på et serverrack. Sånn er det definitivt ikke i dag. Går man igjennom serverhallene til universitetet en høstdag i september er det stort sett bare renholdstjenesten som er å se. Driftsavdelingen sitter og overvåker alt som foregår eksternt. 

– Her bruker vi mindre og mindre maskinvare fordi vi virtualiserer såpass hardt. I dag har vi rundt 20 til en i ratio når det kommer til virtuell maskinvare. Alt vi klarer å putte inn i vitaliserte systemer overføres dit. Exchange, webtjenester og alle mindre tjenester som benyttes kjøres på denne måten. Disse type løsningene forenkler driften såpass mye at det definitivt er veien å gå. Nå ser vi på skyen som det neste naturlige stedet å flytte over til. 

Skytjenester kan bli aktuelt

Men som kjent ligger det offentlige et hestehode bak når det kommer til skytjenester. 

– Vi ser på skytjenester og synes det er veldig spennende. Som universitet er vi opptatt av å gjøre riktige strategiske valg for hvor vi har data. Forskningsdata har gravitasjon og vi må nok ha tjenestene i skyen etterhvert. Sånn sett er vi ikke noe annerledes fra andre kommersielle eller statlige aktører.

(artikkelen fortsetter under)Helene Andreassen, Leif Longva, Stein Høydalsvik og Philipp Conzett ved Universitetsbiblioteket gleder seg til lanseringen.Helene Andreassen, Leif Longva, Stein Høydalsvik og Philipp Conzett ved Universitetsbiblioteket gleder seg til lanseringen. Foto: Karine Nigar Aarskog/UiT

– Vi ligger definitivt ikke i forkant. Det er jo mange ting som regulerer. Bare det å kjøpe maskinvare er en kompleks prosess. Å kjøpe tjenester er enda verre. Vi er jo så klart interessert i å være så effektive som mulig på sikt, sammenfatter Dragseth. 

I dag er det også mye forskning som aldri blir publisert, fordi forskningen ikke gir klare svar eller ikke gir spennende nok resultater. 

– Enhver konklusjon bør være etterprøvbar

– Også disse dataene bør være tilgjengelig, for å unngå dublisering av forskningen, og slik at andre forskere i stedet kan bygge videre på dataene. Enhver konklusjon bør være etterprøvbar, sier fagansvarlig ved UB, Philipp Conzett til UiT.

Det finnes allerede gode eksempler på at man har kommet fram til nye konklusjoner ved å bruke gammelt datamateriale på nytt, skriver universitetet. Ved University of San Francisco fant man en tidligere ukjent sammenheng mellom rehabilitering av ryggmargsskadde og blodtrykket de hadde under sine første operasjoner.

Nevrologer og statistikere kom fram til konklusjonen da de gikk gjennom og analyserte gammel data på nytt – data som for 20 år siden var blitt avskrevet som verdiløse.

– Big data har svirret i lufta i lang tid, og når data blir sammensatt til større mengder, har man mulighet til å analysere dem på nye måter. Men vet ikke hva slags nytte og relevans data har i fremtiden, sier Høydalsvik ved Universitetsbiblioteket.

Kommentarer (1)

Kommentarer (1)
Til toppen