Many Eyes «avslører» statsbudsjettet

Statsbudsjettet kan analyseres på mange måter. digi.no har benyttet IBMs Many Eyes.

Many Eyes Tag Cloud-presentasjon av Nasjonalbudsjettet 2009
Many Eyes Tag Cloud-presentasjon av Nasjonalbudsjettet 2009

Statsbudsjettet kan analyseres på mange måter. digi.no har benyttet IBMs Many Eyes.

Regjeringen la i dag fram Stortingsmelding nr. 1 for 2008-2009, nemlig Nasjonalbudsjettet 2009. Dette er et dokument på mer enn 200 sider, noe som kan gjøre det til en utfordring å finne hva som er det viktigste sakene for Regjeringen for det kommende året.

En teori er at de viktigste temaene i et dokument også er de mest omtalte. Derfor har digi.no kjørt det nye nasjonalbudsjettet gjennom to av verktøyene som tilbys gjennom IBMs Many Eyes-tjeneste.

Det ene verktøyet, Wordle, har vi også tidligere omtalt. Det lager en ordsky av en tekst, hvor de ordene som gjentas oftest blir vist med størst skrift.

Vi har også benyttet et lignende verktøy, Tag Cloud, som gjør det mulig å vise de mest brukte kombinasjonene av to og to ord i en tekst. Denne tjenesten viser også hvor i teksten kombinasjonene finnes, ved at man holder muspekeren over de to ordene. Her kan man også skrive inn egne ord for å se hvilke andre ord som er kombinert med disse.

Begge de to verktøyene skal kunne filtrere vekk de vanligste ordene i språket, slik som infinitivsmerke, artikler og ulike bindeord, men dette fungerer bare til en viss grad. Vi har derfor fjernet et en rekke småord som normalt ikke gir noen mening i presentasjonene, men det kan fortsatt være flere ord som burde ha blitt fjernet. Det er heller ikke utenkelig at enkelte ord burde ha fått stå.

Worldle-presentasjonen av nasjonalbudsjettet vises nedenfor. En større og manipulerbar utgave finnes på denne siden.

Wordle-presentasjon av Nasjonalbudsjettet 2009
Wordle-presentasjon av Nasjonalbudsjettet 2009

Det er ikke sikkert dette er noe godt forsøk på å få bekreftet teorien som presenteres i begynnelsen av artikkelen. Fjerner man ord som «Norge», «kroner», «Nasjonalbudsjettet» og «Regjeringen», er det fortsatt ganske generelle ord som utpeker seg. Ett unntak er «pensjonsfond», som omtales hele 197 ganger i budsjettet.

Ellers kan man legge merke til at ordet «privat» ikke er blant de 150 mest brukte ordene i det filtrerte dokumentet, mens «offentlig» er blant de mest brukte ordene.

Tag cloud-presentasjonen, som vises nedenfor og som er tilgjengelig i full størrelse her, er noe mer avslørende.

Many Eyes Tag Cloud-presentasjon av Nasjonalbudsjettet 2009
Many Eyes Tag Cloud-presentasjon av Nasjonalbudsjettet 2009

Spesielt uttrykk med ordene «offentlig», «olje», «kommune» og «skatt» går igjen. Ser man på de litt mindre brukte uttrykkene, viser presentasjonen at uttrykk som «elektronisk kommunikasjon», «biologisk mangfold», «egen bolig», «fornybar energi», «forskning (og) utvikling», «mot avskoging», «privat konsum» og «sosial dumping» er blant uttrykkene eller konkrete temaene som gjentas mest.

IBMs Many Eyes kan også brukes til å presentere data på andre måter, men i de fleste tilfellene krever dette data satt opp som en tabell, ikke fritekst slik vi har benyttet her.

Man kan få presentert dataene som kurver eller ulike typer diagrammer, for eksempel nettverksdiagrammer som viser relasjonen mellom de ulike entitetene som finnes i dataene.

Det er også mulig å presentere data i kart, enten et verdenskart eller et kart per land.

Many Eyes World Map
Many Eyes World Map

Felles for alt som legges ut i Many Eyes er at det gjøres offentlig tilgjengelig. Dette innebærer at både datamaterialet kan brukes av andre, for eksempel til å presentere dataene på nye måter.

Den filtrerte utgaven av Nasjonalbudsjettet 2009 som vi har benyttet i forbindelse med denne artikkelen, er tilgjengelig her. Den ikke-filtrerte utgaven kan lastes ned fra denne siden.

Many Eyes har et grensesnitt som gjør det enkelt å finne ut hvilken sammenheng diverse ord står i. I dette tilfellet har vi sjekket hva de skriver om når de nevner IKT. Det erogså fullt mulig å klikke seg videre gjennom teksten herfra.
Many Eyes har et grensesnitt som gjør det enkelt å finne ut hvilken sammenheng diverse ord står i. I dette tilfellet har vi sjekket hva de skriver om når de nevner IKT. Det erogså fullt mulig å klikke seg videre gjennom teksten herfra.

    Les også:

Many Eyes er et nytt verktøy, og potensialet er stort selv om det så langt ikke er tatt ordentlig ut. Vi oppfordrer derfor nysgjerrige lesere til å prøve seg litt frem, og dele erfaringene med oss og de andre leserne. Statsbudsjettet bør være et godt utgangspunkt for en tekst som har godt av litt grundig analyse ved hjelp av dataverktøy.

Til toppen