Spillutvikling

Slik lagde utviklerne et morsomt spill av 75 GB med offentlige data om biler

Danske Donkraft Digital har laget «Pokémon Go for biler» ut fra en massiv mengde åpne bildata fra offentlige registre. Det var ikke uten utfordringer.

Du skanner en bil du ser på gaten, så kan du bruke den til å kjøre om kapp med venner på mobilen.
Du skanner en bil du ser på gaten, så kan du bruke den til å kjøre om kapp med venner på mobilen. (Skjermbilde: Donkraft Digital)
EKSTRA

Danske Donkraft Digital har laget «Pokémon Go for biler» ut fra en massiv mengde åpne bildata fra offentlige registre. Det var ikke uten utfordringer.

Hei, dette er en Ekstra-sak som noen har delt med deg.
Lyst til å lese mer? Få fri tilgang for kun 199,- i måneden.
Bli Ekstra-abonnent »

Street Cars er et nytt dansk spill, hvor man skanner biler på gaten og så kjører dem mot vennene sine online. Spillet er gjort mulig av Skats (den danske skatteetaten) motorregister, som utviklerne Donkraft Digital baserer sitt spill på.

Utviklerne ble imidlertid overveldet da de fikk fingrene i databasen første gang. Den var nemlig en 75 GB XML-fil med data om alle registrerte biler, fra bilskiltet ble innført i Danmark i 1903 og frem til 2018, forteller Simon Vestergaard, «lead programmer» på spillet.

– Og ut av de mer enn 50 forskjellige datapunkter var det omkring 15 som vi rent faktisk kunne bruke, forteller Vestergaard. 

(Artikkelen fortsetter under)

Ser du en rå bil på gaten, kan du skanne den inn for å legge den i samlingen din.
Ser du en rå bil på gaten, kan du skanne den inn for å legge den i samlingen din. Skjermbilde: Fra reklamevideo for Street Cars

Det var data om alt fra CO2-utslipp til antall dører på bilene, data som var fullstendig irrelevant for spillet. Donkraft Digital sto derfor overfor et skikkelig opprydningsarbeid, før de overhodet kunne begynne å leke med bilene.

Les også: Spill bygger på Skats data om 2,5 millioner biler (version2.dk)

Tastefeil og manglende data

Målet med datasettet er å identifisere en konkret bilmodell og data om bilens toppfart, kjøreevne, etc. når et bilskilt skannes av appen. Så da datasettet endelig var renset for data som ikke kunne brukes til å identifisere bilmodellen, møtte Donkraft Digital på det motsatte problemet. Det var ikke nok data om to viktige punkter for spillet: fart og registreringsår. 

Spesielt fart var kritisk, da dette parameteret skulle brukes direkte til å kjøre om kapp i spillet. Det var særlig eldre registreringer av biler som manglet data. Den utfordringen løste utviklerteamet ved å samkjøre data i en database med EU-typenumre, som fordoblet antallet registreringer under de mangelfulle datapunktene.

– Så hadde vi selvfølgelig også de vanlige problemene med skrivemåte. En Tesla kunne både være registrert som Model S, Model-S, S-Model og så videre, forteller Vestergaard.

Et av de mer ødeleggende problemene for spillet var også tastefeil. Teamet fant for eksempel en bil i systemet som angivelig kunne kjøre 2600 kilometer i timen, hvilket ville gi en signifikant fordel til den heldige spiller som skannet den.

16 klassifiseringer

Med et tilstrekkelig fyldig og renset datasett kunne teamet endelig gå i gang med å leke. De lagde et system som sorterte biler etter data om vekt, kjøreevne og registreringsår i 16 kategorier. Disse kategoriene bestemte hvordan det skannede bilskiltet ble oversatt til en bil i spillet.

Det var nemlig ikke realistisk å lage en 3D-modell til hver eneste unike bil i Danmark, og modellene er derfor tildelt en 3D-modell ut fra 16 klassifiseringer slik som «tung sportsbil» eller «mini luksusbil».

Her oppsto det igjen problemer med Teslaene og de øvrige elbiler, da de er tyngre enn de øvrige biler i deres kategorier. Det ble derfor satt en fast vekt for alle elbiler, så de ble mer korrekt klassifisert.

Med en sorteringsalgoritme på plass og en masse flotte 3D-modeller klare, gikk teamet på gaten for å teste spillet – noe som førte til mistenksomme blikk.

– Folk trodde rett og slett at vi var parkeringsvakter. Vi måtte forklare oss overfor flere bileiere som trodde vi fotograferte bilskiltene deres for å sladre om hvordan de hadde parkert. Men de syntes heldigvis det var kult nok da vi forklarte dem om vårt spill, forteller Vestergaard.

Endelig skulle bilene kunne kjøpe om kapp. Her brukes data direkte fra motorregisteret omkring toppfart og aksellerasjon til å påvirke bilenes kjøreevne på spillets lille bane, mens manøvreringsevnen bestemmes ved å samkjøre data om blant annet vekt.

Fremtidige utfordringer

Donkraft Digital har også tatt en rekke sikkerhetshensyn i utviklingen av spillet. Appen fanger ikke opp lokasjonsdata, da det ville være uheldig hvis man kunne finne ut av hvor dyre sportsbiler var parkert ved å hacke appen.

Vestergaard innrømmer likevel at folk teoretisk kan jukse i spillet ved å manipulere det åpne datasettet, men tviler likevel på at en medarbeider i Skat ville risikere jobben sin for å bli den raskeste føreren på kontoret. 

Mer teknisk kyndige juksemakere kan da også selv laste ned datasettet og finne frem til Danmarks raskeste biler og skanne dem, men det er ikke noe som holder Vestergaard våken om natten.

Donkraft Digital jobber med å forbedre spillet i Danmark, men planlegger å utgi i flere land i fremtiden. Derfor skal de leke seg med enda flere, og enda større, datasett i fremtiden. De skal bare løse et lite praktisk problem først:

Bilenes farge i spilles bestemmes av en bildegjenkjenningsalgoritme, og den blir i sitt nåværende stadium lurt av mangel på lys. Skanner man bilen om natten, får man derfor mange svarte biler.

Artikkelen er levert av Version2.dk

Sjekk oversikten: Hvem tjener best av en Java- og en C#-utvikler? (Ekstra)

Kommentarer (0)

Kommentarer (0)
Til toppen