På bloggen sin har Google nå kunngjort lanseringen av en ny søkemotortjeneste. Den heter Dataset Search og er et nytt initiativ for å gjøre søkingen av relevant informasjon enklere.

Som navnet antyder retter den nye søkemotortjenesten seg mot folk som har behov for å lete frem datasett i ulike sammenhenger, for eksempel for forskere eller i bedriftsøyemed.

Millioner av datasett

Google peker på at det finnes tusenvis av datarepositorier på Internett med millioner av datasett, og hensikten med den nye søkemotoren er altså å gjøre det lettere å finne frem til disse uten å måtte tråle gjennom massevis av irrelevante søkeresultater på Google.

Den nye tjenesten fungerer ifølge Google litt på samme måte som den eksisterende tjenesten Google Scholar, som indekserer fulltekst eller metadata for akademisk litteratur på nettet på tvers av formater og disipliner.

Foto: Skjermdump

Det innebærer at Dataset Search styrer brukerne til datasett der de hostes, slik som for eksempel på utgiverens egen nettside, digitale bibliotek eller på en forfatters egen nettside.

Åpen standard

På utviklersiden har Google sluppet egne retningslinjer som bør følges for å gjøre datasettene enklest mulig å finne, slik som å oppgi både navn, beskrivelse, forfatter og distribusjonsformat. Tidspunktet for publisering og hvordan dataene ble samlet inn er også blant retningslinjene.

Dataene beskrives av en åpen standard kalt Schema, som Google oppfordrer alle tilbydere av datasett å adoptere for å gjøre tjenesten best mulig.

Dataset Search fungerer på flere ulike språk, inkludert norsk, men enn så lenge er nok antallet tilgjengelige datasett noe begrenset. Tjenesten er altså fremdeles i en betafase og skal videreutvikles i tiden fremover.

