Sporing av smartmobiler kan fortelle svært mye om atferden til brukerne. Det kan blant annet avsløre hvor de bor, arbeider, handler og hvem de besøker. Det kan også fortelle mye om hvordan brukerne kommer seg til de ulike stedene.

Dette ønsker Transport for London (TfL), etaten som har ansvaret for kollektivtransporten i den britiske hovedstaden, å utnytte for å kunne forbedre tjenesten knyttet til London Underground, også kalt The Tube.

Wifi-enheter

Den 8. juli begynner etaten å hente inn data fra alle enheter med wifi-støtte som befinner seg på de drøyt 260 undergrunnsstasjonene i storbyområdet som i dag tilbyr wifi-basert internettilgang. Dette opplyser TfL i en pressemelding.

I dag brukes billettsystemet til å registrere når passasjerene ankommer og forlater undergrunnsstasjonene. Men disse dataene forteller ingenting om hvordan passasjerene beveger seg gjennom stasjonen.

Dette kan derimot registreres av wifi-rutere på stasjonen, så lenge passasjerene har med seg en enhet hvor wifi er aktivert.

MAC-adresser og anonymisering

Systemet, som er utviklet av TfL selv, vil registrere MAC-adressen (Media Access Control) til wifi-modulen i enheten. Dette skjer uavhengig om brukeren har knyttet enheten til wifi-nettet eller ikke, men det er stort sett bare enheter som faktisk har blitt tilknyttet wifi-nettet til TfL, som kan gi noen meningsfylt informasjon.

Årsaken til dette er at de fleste moderne enheter oppgir vilkårlige MAC-adresser til ukjente rutere, inntil brukeren kobler enheten til wifi-nettet for første gang. Da vil enheten normalt oppgi den faktiske MAC-adressen.

Dataene fra de ikke-autentiserte enhetene blir ikke brukt i selve analysen. Det gjør derimot den autentiserte enheten, altså de som har vært eller er logget på wifi-nettet til TfL. For å anonymisere brukerne, blir ikke selve MAC-adressen tatt vare på. Før dataene lagres, benyttes det TfL kaller en automatisk, enveis «pseudonymiseringsprosess», antagelig en form for hashing.

For å være helt uberørt av systemet, må wifi skrus av på enheten.

Dataene som prosesseres, er da tidspunktet hver av de autentiserte enhetene ble registrert, og posisjonen til ruteren som registrerte enheten.

Tidligere pilotprosjekt

Dette kan blant annet fortelle TfL hvor lang tid enheten bruker på reisen mellom ulike stasjoner, hvilken rute som benyttes, samt ventetiden i de travleste periodene.

TfL regner med å kunne dra nytte av de innsamlede dataene temmelig raskt. Noe av årsaken til dette, er at dette ikke er første gang TfL registrerer wifi-enheter på denne måten. I 2016 gjennomførte etaten et begrenset pilotprosjekt som i løpet av fire uker, og basert på data fra 54 ulike undergrunnsstasjoner og mer enn 509 millioner dataposter. Disse ble samlet inn fra 5,6 millioner enheter som til sammen gjorde 42 millioner reiser.

Analysen av disse dataene viste blant annet passasjer som reiser mellom stasjonene King's Cross St Pancras og Waterloo benyttet minst 18 forskjellige ruter. Av disse var det rundt 40 prosent som ikke tok noen av de to mest populære rutene.

Åpent API

Allerede senere i år TlF begynne å tilby kundene data om trengselen på stasjonene. Dette skal gjøres på nettstedet til etaten. Dette skal kunne hjelpe kundene med å planlegge reiser på tvers av London.

Det planlegges også tidlig varsling om opphopning av mennesker i billettområdene og på perrongene, noe som skal gi passasjerene bedre mulighet til å endre ruten sin underveis. Varslingen skal gjøres via nettstedet eller sosiale medier.

Dataene skal også gjøres tilgjengelige gjennom et fritt tilgjengelig og åpent programmeringsgrensesnitt (API), som kan benyttes av både tredjeparter til å utvikle nye produkter og tjenester, inkludert mobilapper.

I tillegg skal de ansatte ved stasjonene få tilgang til informasjonen og vil dermed kunne gi passasjene bedre råd om hvordan de enklest kan komme fram til reisemålet.

TlF skal sette opp tyde skilt i de berørte områdene, hvor passasjerene om systemet og om hvordan deres enheter kan unngå å bli registrert.

Stort ansvar

Lauren Sager Weinstein, datadirektør i TfL, sier i en pressemelding at fordelene med dette anonymiserte datasettet er enorme.

– Selv om jeg er begeistret over potensialet for dette nye datasettet, er jeg tilsvarende bevisst på ansvaret som følger med det. Vi tar personvernet til hver kunde ekstremt alvorlig og vil ikke identifisere individer fra wifi-dataene som samles inn. Dataarbeidet i samfunnet må være basert på åpenhet, personvern og etikk, og vi erkjenner at tilliten som kundene gir oss, og tryggingen av kundenes data, er absolutt fundamental, sier Weinstein.

Arbeidet med systemet skal være gjort i tett samarbeid med det nasjonale datatilsynet i Storbritannia, Information Commissioner's Office.

