Slik finner datamaskiner planeter

Å lete etter eksoplaneter er som å finne nåla i høystakken. Datamaskiner og maskinlæring er nyttige verktøy, men de kan ikke gjøre dette alene, og er ikke brukbare på helt store datasett – ennå.

Stjernesystem med åtte eksoplaneter ved stjernen Kepler 90. Illustrasjon: NASA/Wendy Stenzel

AV JENS RAMSKOV, ING.DK

23. des. 2017 - 05:00

Nasas Kepler-satellitt har allerede oppdaget flere enn 2000 planeter i andre stjernesystemer –såkalte eksoplaneter. Like mange observasjoner er foreløpig registrert som potensielle kandidater, og venter bare på en ytterligere vurdering.

Dette kan derfor virke som en nesten triviell nyhet, siden det i nettopp ble meldt at man nå hadde funnet to nye eksoplaneter, hvorav den ene var i et stjernesystem som nå offisielt har like mange planeter som vårt solsystem – åtte.

Tre forskjellige nettverk

Et nevralt nettverk består helt generelt av et input-lag som tar imot rådata, og et output-lag, som gir en bestemmelse i forhold til input-dataene – i det aktuelle tilfellet om input-data er tegn på eksistensen av en eksoplanet.

Mellom input-lag og output-lag kan det være ett eller flere skjulte lag, der programmet lærer seg selv best mulig å justere hvordan et lag påvirker det neste, så det endelige output-laget gir det mest korrekte resultatet.

Christopher J. Shallue testet tre ulike typer av nettverk.

Lineært nettverk: Et enkelt nevralt nettverk uten skjulte lag. Her antas det implisitt at data på en helt enkel måte kan deles opp i planeter og ikke-planeter.

Fully connected nevral network: Et hierarkisk oppbygd nettverk med flere skjulte lag, hvor output fra ett nettverk er input til det neste. Det er den mest generelle type av nevralt nettverk med færrest mulige antakelser om input-data.

Convolutional network: Et mer komplisert nettverk, hvor hvert lag består av et convolution-lag (foldningslag) og et pooling-lag. Denne formen for nevralt nettverk har tidligere vist seg godt egnet til romlig strukturerte inputdata som for eksempel ved talesyntese og bildeklassifisering.

Selv om dette ble slått opp som en stor nyhet mange steder, er det nå ganske uinteressant. Metoden som ble brukt for å finne de to eksoplanetene, er derimot svært interessant.

Metoden har fremdeles klare begrensninger, men kan potensielt – etter en videreutvikling – bli nyttig.

Det var nemlig et nevralt nettverk – som hadde lært seg selv å finne planeter i de mange dataene fra Kepler – som utpekte de to nye eksoplanetene. Det illustrerer på en utmerket måte at maskinlæring har mange bruksområder.

Men et grundigere studium av metoden, viser også at man riktig nok kan bruke maskinlæring og nevrale nettverk for å finne eksoplaneter, men metoden har også sine begrensninger.

Det går tydelig fram av den vitenskapelige artikkelen om funnet av de to eksoplaneter av Christopher J. Shallue fra Google og Andrew Vanderburg fra University of Texas i Austin, Texas.

Artikkelen er godkjent for publisering i tidsskriftet The Astronomical Journal.

Fully connected neural network. Illustrasjon: Nasa/Google

Convolutional network. Illustrasjon: Nasa/Google

Slik finner Kepler satellitter

Det finnes flere metoder for å bestemme planeter i stjernesystemer som ikke kan ses direkte med selv de beste teleskopene i rommet eller på Jorden, fordi de er små og mørke.

Kepler observerer en stjerne gjennom lengre tid. Og dersom stjernens lysstyrke regelmessig ser ut til å reduseres, kan det være fordi en eksoplanet i et kretsløp rundt stjernen skygger for en del av lyset fra stjernen.

Dermed er det bare å finne disse karakteristiske og regelmessige reduseringene av lys, og dermed har man en potensiell kandidat til en eksoplanet.

Men alt dette blir litt vanskeligere på grunn av at en liten planet bare gir en liten skygge, så signalene er ikke alltid så pene og regelmessige som teorien vil ha det til. Og det kan også være andre astronomiske forklaringer på slike observasjoner, og de er man nødt til å utelukke som årsak.

Når man har en kandidat til en eksoplanet, har man derfor i beste Sherlock Holmes-stil en stor jobb med å utelukke alle andre muligheter før man med sikkerhet kan fastslå at det er funnet en ny eksoplanet.

I den perioden Christopher J. Shallue hadde for selvstendig arbeid hos Google, så han nærmere på muligheten for å automatisere metoden for å finne kandidater til eksoplaneter i Keplers store data ved hjelp av maskinlæring.

Han lagde derfor et nevralt nettverk – faktisk lagde han flere ulike – som ut fra sammenhengen mellom data og erklærte eksoplaneter lærte seg å finne nye eksoplaneter.

Tre forskjellige nettverk. Et convolutional nettverk er best, siden det for eksempel med en recall på 95 prosent (det vil identifisere 95 prosent av alle reelle planeter som eksisterende planeter), har den høyeste presisjonen på 90 prosent (90 prosent av alle klassifikasjonene dens er reelle planeter). Illustrasjon: Nasa/Google

Målet er vanligvis at det nevrale nettverket etter endt opplæring skal identifisere minst 95 prosent av alle potensielle planeter som eksisterende planeter.

Når programmet har lært seg det ut fra en del av datasettet, kan man teste hvorvidt en annen del av datasettet også kan inneholde mulige kandidatene.

En spesiell form for nevralt nettverk, kalt et convolutional nettverk, viste seg å være flinkest til å finne nye planeter.

De nye eksoplanetene

Med dette nevrale nettverket kunne man endelig gå på jakt etter data som ennå ikke var undersøkt i Keplers enorme base, for å se om man kunne finne eksoplaneter som ikke var oppdaget tidligere.

Det ble valgt ut data fra 670 stjerner med flere enn én eksoplanet. Det er en ekstremt liten del av det samlede datasettet, siden Kepler har studert omkring 200 000 stjerner.

Her fant de 513 nye såkalte treshold crossing events eller TCE, som kunne skyldes en eksoplanet.

Modellen forutsa at 30 av disse, med en sannsynlighet større enn 50 prosent, var forårsaket av en eksoplanet. Av disse valgte man ut de ni med en sannsynlighet som var større enn 80 prosent, til en særskilt analyse.

Etter en del feltarbeid ble disse ni kandidatene redusert til tre, siden man ikke kunne utelukke andre forklaringer på hendelsen enn en eksoplanet for de andre.

Og av disse tre viste det seg at bare to med full sikkerhet kunne være eksoplaneter, selv om Shallue og Vanderburg gjør rede for at den tredje TCE også har mange indikasjoner på å være forårsaket av en eksoplanet.

Maskinlæring har dermed vist seg å være en brukbar metode for å finne nye TCE-er som kan skyldes en eksoplanet. Men det er en enorm oppgave i ettertid å utelukke at andre astronomiske forhold kan ha gitt disse signalene.

Eksisterende programvare er bedre på visse punkter

Eksoplanet-jegere bruker naturligvis allerede i dag programvare til analysene sine, som for eksempel Nasas Robovetter. Dette systemet er fremdeles på mange måter bedre enn det nye maskinlæringsprogrammet.

(Artikkelen fortsetter under)

Her ser man hvordan lysstyrken fra stjernen Kepler 90 endres når planeten Kepler 90i passerer stjerneskiven. De grå punktene er gjennomsnittsverdier over en periode på 10 minutter, mens de lilla punktene er et gjennomsnitt for en firedel av passasjetiden, som i det aktuelle tilfellet tilsvarer omkring 45 minutter. Omløpstiden for planeten er 14,45 dager, og planetens radius er vurdert til 1,32 ganger Jordens. Illustrasjon: Foto

Shallue og Vanderburg innrømmer derfor i konklusjonen i den vitenskapelige artikkelen sin at metoden både har fordeler og klare begrensninger. Det vil for eksempel være helt urealistisk å bruke metoden på svært store datasett, på grunn av den påfølgende omfattende analysen.

Men de bemerker også at de har tenkt seg å prøve å forbedre modellen for å finne flere bruksområder.

Så det vi har sett nå, er kanskje bare første skritt i retning av mer avanserte systemer for å lete etter eksoplaneter. Og siden vi har sett hva kollegene hos DeepMind har oppnådd innen maskinlæring med AlphaZero, bør det ikke overraske hvis denne metoden på sikt kan slå andre av banen.

Les også: AlphaZero spiller sjakk på en overnaturlig måte (ing.dk)

Artikkelen er levert av ing.dk

Maskinvare Operativsystemer og programvare

Kommentarer:

Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.

Se flere jobber

Hvordan lage en stillingsannonse på Tekjobb?

Les mer