DNA-basert lagring

Terabytes med data kan lagres i en flekk med DNA

Åpner for mye mer kompakt lagring.

Hver av basene i DNA - A, C, G og T, kan representere en binær verdi.
Hver av basene i DNA - A, C, G og T, kan representere en binær verdi. (Bilde: PantherMedia / Sergey Volkov)

Åpner for mye mer kompakt lagring.

Mengden av data som vi ønsker å ta vare på, vokser rasker enn kapasiteten til lagringsenhetene. Selv om data kan lagres mye mer kompakt nå enn for bare noen år siden, tar den økende mengden av lagringsenheter stadig mer plass.

Dersom denne utviklingen fortsetter, og ingenting tyder på noe annet, vil det snart være behov for helt nye lagringsteknologier som virkelig kan lagre mye mer data innenfor et lite område. En slik mulig «teknologi» er DNA.

– Livet har produsert dette fantastiske molekylet som kalles for DNA, som effektivt lagrer alle typer informasjon om genene dine og hvordan et levende system fungerer. Det er veldig, veldig kompakt og svært varig, sier Luis Cexe i en pressemelding. Han er førsteamanuensis ved University of Washington og deltar i en forskningsgruppe som har utviklet et system som kan kode, lagre og hente digitale data ved å bruke DNA-molekyler.

Norsk kode skal gjøre det langt billigere å lagre mye 

Exabyte

Ifølge forskningsartikkelen om arbeidet er den teoretiske lagringstettheten på 1 exabyte per kubikkmillimeter, altså en milliard gigabyte. Dette er ifølge forskerne minst en million ganger høyere lagringstetthet enn det som er mulig med dagens lagringsteknologier. Samtidig skal DNA kunne ta vare på informasjonen i hundrevis av år, selv under ganske ugunstige forhold. Og det er nettopp langsiktig arkivering som DNA-baserte lagringssystemer antagelig vil kunne egne best seg til.

Data som lagres i DNA, lagres på et stort antall syntetiserte DNA-molekyler som deretter dehydreres eller på annen måte gjøres egnet for langtidslagring.

Den blekrosa flekken i prøverøret til høyre har kapasitet til å lagre 10 terabyte med data.
 

Noe av vanskeligheten med DNA-tilnærmingen er å finne tilbake til dataene. Dette sammenlignes av forskerne med å sette sammen et kapitel fra en fortelling i et bibliotek av bøker som har blitt revet fra hverandre.

Forskningsgruppen, som også har et medlem fra Microsoft Research, har valgt en tilnærming hvor noe som kan som kan sammenlignes med postnumre og gateadresser, har blitt kodet inn i DNA-sekvensene. Det benyttes teknikker som har blitt utviklet av bioteknologi-industrien for å gjenfinne adressene. Teknologi kjent fra dataminne, slik som feilkorrigerende koder (ECC – Error-Correcting Code), benyttes ved selve kodingen av dataene.

Bilder og video

Nå er det ikke de helt store datamengdene forskerne har eksperimentert med så langt. Det dreide seg i første omgang om i alt fire bildefiler på opptil 84 kilobyte som feilfritt har blitt lagret og lest av igjen. Men det samme skal også ha blitt gjort med et videoopptak, uten at det er oppgitt hvor plasskrevende dette er.

Forskerne mener at det største hinderet for at DNA-lagring skal kunne bli en aktuell lagringsteknologi er knyttet til kostnaden og effektiviteten ved syntetisering (lagring) og sekvensering (lesing) i stor skala. De mener likevel at det ikke er noen tekniske hindre for å oppnå dette dersom de rette incentivene er tilstede.

Til toppen