Web-protokoll for tabeller og statistisk analyse

Ved National Center for Data Mining i Illinois utvikles DSTP - Data Space Transfer Protocol. Målet er å kunne hente tabeller fra ulike kilder og analysere dem med web-formidlede verktøy.

DSTP bærer i seg et løfte om å gjøre for data og dataanalyse det HTTP ("hypertext transfer protocol" - årsaken til at alle nettadresser starter med http://) har gjort for tekst. Det skal tilby tilgang til datatabeller over web og åpne for bruken av web-baserte analyseverktøy. Om tabellene opprinnelig stammer fra filer, databaser eller datavarehus, spiller ingen rolle. Alt gjøres tilgjengelig under en og samme form, og formatet gjør det mulig å kople tabeller til hverandre selv om de stammer fra vidt forskjellige kilder. Webbaserte analyseverktøy kan gjøre det mulig å gjennomføre statistiske beregninger og analyser, som korrelasjon og regresjon. Man kan også tenke seg at regneark og personlige databaser som Excel og Access vil være i stand til å lese DSTP-filer og brukes til analyseformål, eller at det utvikles egne DSTP-baserte analyseverktøy for enbrukere.

I alle fall er visjonen klar. Dette er "data mining" for massene. Det vil også lette arbeidet med å lage verktøy til beslutningsstøtte, utvikle og distribuere indekser og nøkkelindikatorer, og så videre. I undervisning eller opplæring vil elever og studenter kunne få tilgang til all slags statistiske tabeller, og boltre seg med kreative analyseverktøy.

DSTP utvikles av forskere ved National Center for Data Mining (NCDM), en avdeling under University of Illinois i Chicago. For å demonstrere konseptet har forskerne laget en web-klient som kan koples til DSTP-tjenere, hente data, utføre statistiske analyser og generere grafiske framstillinger. Web-klienten, kalt DataSpace Web, er tilgjengelig for alle fra senterets nettsted. Den har form av en Java-applikasjon og kjører på en Apache webtjener.

Foreløpig er utvalget av DSTP-tjenere naturlig nok sterkt begrenset. Utviklingsarbeidet medfører også at klienten ikke alltid er tilgjengelig.

Med DSTP følger naturlig nok DSML - Data Space Markup Language - som gjør database tilgjengelig for distribusjon gjennom DSTP, på samme måte som HTML (hypertext markup language) gjør hypertekst tilgjengelig for distribusjon gjennom http.

Les mer om verktøy for beslutningsstøtte:


Klikkstrømanalyse gir lønnsom e-forretning
Sovende data kan lamme et datavarehus

;