Teknologidirektør Stig Alstedt forsvarer "Big Data" og svarer Anders Orset sin kommentar: – Big Data lurer deg inn i filterboblen.

– Må skille snørr og barter

HPs teknologidirektør svarer i Big Data-diskusjon.

Dette er et tilsvar til debattinnlegget «– Big Data lurer deg inn i filterboblen» av Anders Orset.

DEBATT: Takk for en flott kronikk og innlegg i debatten! Dette var velformulert og godt skrevet, men jeg føler nok at du skyter noe over mål. Jeg forstår din bekymring, men jeg deler den ikke.

Aller viktigst, vi må ikke forveksle Big Data med et sensurfilter. Algoritmene bak store data er ment å gi deg anbefalinger, ikke begrensninger. De fjerner ikke informasjon, de rangerer den. Forskjellen er enorm.

Jeg tror derfor det første vi må gjøre er å skille snørr og barter, og for meg er det stor forskjell mellom en søkemotor (som mest mulig nøytralt skal presentere deg for det du leter etter), og en netthandel (som skal forsøke å selge deg mest mulig).

Forventningen til objektivitet er nødvendigvis mye høyere for førstnevnte, men det betyr jo ikke at de ikke skal tilpasse ditt søkeresultat til nettopp deg. Hvordan i all verden skulle de ellers gjøre det? Nesten alle dine søk tar jo som utgangpunkt at du vet hva du leter etter, du bare vet ikke hvor du finner det.

Det er typisk færre enn 10 prosent av brukerne som blar til side to av et søkeresultat (faktisk klikker mer enn halvparten av brukerne kun på de to første linkene), så en leverandør prøver med alle sine ressurser å samle det de tror du ønsker å se allerede på første side – selvfølgelig helst helt øverst. Folk flest er bedagelige av natur, det er derfor de kommersielle kreftene satser på å legge ting til rette for dem slik at de slipper unna med minst mulig arbeid. Og det er jo nettopp det som er deres bransje; å hjelpe deg med å finne det du er ute etter raskest mulig.

For å snu det på hodet, kan man faktisk si at algoritmene er din beste allierte til å hjelpe deg å finne ting som er relevant for deg. Hvis en søkemotor skulle presentere deg med et fullstendig urangert materiale ville det medføre at du aldri ville finne det du faktisk var ute etter. Men for å forhindre dette er leverandøren faktisk nødt til å ta noen forutsetninger, og det er her Big Data kommer inn.

På få år har internett gitt menneskeheten tilgang til brorparten av alt materiale som vi har produsert, og det er så voldsomt mye informasjon at du faktisk trenger rangeringsalgoritmer. Det ville være fullstendig umulig for deg å navigere rundt hvis ikke noen hadde grovsortert informasjonen før den ble presentert til deg.

At vi plutselig har fått internett tilgjengelig fritar selvfølgelig ikke enkeltpersoner fra den plikt man har hatt så lenge vi har hatt fri presse; nemlig å orientere seg mot forskjellige og uavhengige kilder. Hvis du velger å bruke Klassekampen som din eneste kilde til informasjon om det norske samfunnet vil du nødvendigvis ikke bli eksponert for annet enn deres verdensbilde.

Latskap og uvilje til å søke andre kilder har alltid hatt den samme konsekvens for brukeren; ensporethet eller manglende evne til å utvide sin horisont eller forstå andres synspunkter. Internett forandrer ikke på noe av dette i den ene eller andre retningen.

For noen generasjoner siden var det slik at de som ikke tok seg bryderiet med å lære å lese forble uopplyste, men man kunne jo ikke forby bøker av den grunn.

Big Data er ikke noe mer mystisk enn en automatisering av den jobben redaksjoner har gjort i pressen, og markedsavdelinger har gjort i varehandel. Til alle tider er det folk som har hatt som jobb å gjette på hva det er du er interessert i, slik at deres produkt eller publikasjon skal fenge deg.

Jeg synes det er et større problem at folk anser Facebook som en nyhetskilde, snarere enn at Facebook begynner å gjette på hvordan du vil ha sortert innholdet i din feed, en feed som tross alt består av materiale fra kilder som du selv har valgt ut.

Vi må også skille mellom begrepene relevans og interesse. Det er faktisk slik at folk til alle tider har vært mest opptatt av seg selv og det som er en selv nærmest. Det er derfor vi har lokalaviser, lokalradio og 428 kommuner i Norge. Så man ØNSKER normalt et lokalt tilsnitt på det man leter opp. Hvis jeg sitter på Majorstua og googler etter en kinarestaurant ønsker jeg jo implisitt at de skal filtrere vekk de som finnes i Molde og Hammerfest, fordi de ikke er relevante for meg. Men det betyr jo ikke at det senere er umulig for meg å finne en kinarestaurant i Molde skulle jeg trenge det på et tidspunkt.

En del av denne debatten har gått på Twitter. De bruker Big Data-baserte algoritmer til å foreslå nye brukere til meg som de tipper jeg vil like. Siden Twitter har flere hundre millioner brukere, er forslaget på tre-fire stykker selvfølgelig basert på en eller annen utvelgelsesalgoritme (med åpenbart forbedringspotensiale, siden forslagene de har til meg ofte er svært pussige). Det betyr jo ikke at jeg skal slutte å bruke Twitter. Hvis jeg ikke liker forslagene kan jeg jo bare velge å ignorere dem. Jeg opplever heller ikke forslagene som begrensende på mitt verdensbilde. Hvis jeg ønsker å koble meg til andre brukere kan jeg jo bare søke dem opp selv, algoritmen har jo ikke fjernet min tilgang til øvrige brukere.

Det er ingen hemmelighet at nettbutikker ønsker å selge deg ting. Det bør jo heller ikke være så forulempende, for siden du navigerer rundt i butikken til f eks Amazon er du vel i utgangpunktet interessert i å kjøpe noe. Amazon er jo tross alt en butikk, og ikke et bibliotek. De gjør ikke noe annet enn enhver bokhandel har gjort siden bøker ble allemannseie; nemlig å lage en utstilling med utgivelser som de tror appellerer til kunden. Forskjellen er bare at en fysisk bokhandel av praktiske årsaker er nødt til å lage en utstilling tilpasset gjennomsnittskunden, mens Amazon takket være sitt virtuelle nærvær er så heldige at de kan lage en utstilling som er tilpasset akkurat deg.

Gjennom bruk av Big Data har de attpåtil mulighet til å endre utstillingen i fart mens du tar din virtuelle rusletur gjennom butikken. Og det er jo ikke annet en avansert reklame. Hvis man frykter dette burde man forby all reklame, for i sin pureste form prøver jo reklame å få deg til å kjøpe noe du i utgangspunktet ikke ha tenkt på å anskaffe deg?

Big Data-filtreringen trenger jo heller ikke å være begrensende for hva du blir presentert. Den kan også brukes i invers. Amazon kan like gjerne foreslå å selge deg bøker som er «motsatt» av det de i utgangspunktet gjetter på at du vil ha. Og hvis en slik motsattfunksjon viser seg å få deg til å handle mer kan jeg garantere at de implementerer den uten at du trenger å be dem om det (for alt jeg vet er slikt innebygd allerede).

Man skal ikke i utgangspunktet være redd for kommersielle interesser. Selv om vi i Norge ofte tror noe annet er det tross alt profitt og marginer som får verden til å snurre, og bedrifter er faktisk avhengige av at kundene deres er så tilfredse at de handler, handler mye, og handler igjen. Det er jo derfor det er i bedriftenes absolutte interesse å sørge for at du som kunde ikke er misfornøyd. Husk også på at Big Data og særlig sosiale medier har gitt enkeltpersoner og forbrukermakt en fantastisk gjennomslagskraft. Hvis store virksomheter trår skikkelig feil risikerer de i dag massiv motstand og negativ publisitet de for en hver pris vil unngå.

Hvis man anser rangeringsalgoritmer som et potensielt kjempeproblem tror jeg man undervurderer den menneskelige frie tanke og nysgjerrighet. Det er ikke noe tvil om at videoer med søte små kattepuser er det mest populære innholdet på internett. Men det gjør det ikke det til det viktigste, og det er jeg ganske sikker på folk forstår. Akkurat på samme måte som folk vet at man ikke har fått med seg ALT som har skjedd i verden selv om man har sett på Dagsrevyen. De som ønsker å finne alternative kilder og informasjon har i internett fått et fantastisk verktøy til å gjøre akkurat det.

Big Data har også endeløse bruksområder for å løse humanitære og samfunnsnyttige oppgaver, gjerne på ideelt grunnlag. Folkehelse, klimaforskning, befolkningsanalyse, kriminalitetsbekjempelse er bare noen av en lang rekke felter som allerede har dratt nytte av de nye mulighetene som har åpnet seg med denne teknologien. Som så ofte ellers i samfunnet er det gjerne kommersielle krefter som er drivere av utviklingen, men det er ikke noe argument for ikke å ta det i bruk også i det offentlige.

Stig Alstedt er teknologidirektør i HP Norge.

    Les også:

Til toppen