Bedre søk med AltaVista

Digital har nå begynt utprøvingen av en ny utgave av selskapets søkeverktøy AltaVista. Foreløpig er det bare Palo Alto-serveren som støtter de nye tjenestene.

Stein A. J. Møllerhaug (bildet), Digitals produktansvarlige for AltaVista i Norge, forteller til digi.no at AltaVista nå er i ferd med å få mer effektive søkemetoder.

- AltaVistas innhold er lite strukturert, samtidig som den mer eller mindre indekserer hele Internett. Dette medfører at man kan få svært mange oppslag når man søker etter spesielle ord eller fraser. Nå skal AltaVista få en funksjon som kalles Refine, forteller han.

Denne gjør det enklere å skille ut sider man ikke ønsker å ha med i søket. Refine lister opp fraser som er utbredt i de web-sidene søket returnerer, og brukeren får muligheten til å inkludere eller ekskludere ordene ved hjelp av små menyer.

- Poenget med dette er å kunne zoome så godt som mulig inn mot hva man virkelig søker etter. Etter to til tre omganger med Refine er gjerne antall mulige sider blitt redusert betydelig, forklarer Møllerhaug.

Likevel tror Møllerhaug at dette kan være for tungvint for noen.

- Derfor vil AltaVista også tilby en grafisk framstilling av sammenhengen mellom ordene man kan inkludere eller ekskludere fra det videre søket, sier han.

Siden AltaVista til tider har vært vanskelig å finne frem i, har Digital nå laget en indeks. Indeksen er hierarkisk oppdelt, med 12 hovedkategorier, for eksempel "Computers & Internet", "Business & Finance" og "Health & Fitness". Disse kategoriene er igjen oppdelt mindre grove kategorier, og til slutt kommer man til en oversikt over nettsteder som skal dekke det man er på utkikk etter. Foreløpig består indeksen av nesten 17.000 emner. Digital har kalt funksjonen Browse by Subject.

To andre nyheter er People Search og Business Search. Den førstnevnte tjenesten gir brukeren muligheten til å søke etter personer på bakgrunn av fornavn, etternavn og/eller bosted. Da får man opp en oversikt over navn på personer som passer til søkeordene, samt deres adresse og telefonnummer. Altså slags telefonkatalog på nettet

Den andre søketjenesten er en form for "gule sider". Her kan man altså søke etter bedrifter innen en rekke forskjellige bransjer. Tjenesten inkluderer også elektroniske by- og veikart som viser nøyaktig hvor bedriften holder til.

Begge disse søketjenestene er basert på kataloger bedriften Switchboard leverer. Foreløpig er det kun mulig å søke etter personer og bedrifter i USA, men en norsk utgave av tjenesten er ifølge Møllerhaug under oppbygging.

Også under skallet er AltaVista under utvikling. Indekseringen er blitt mer effektiv, og søkemotoren skal nå kunne håndtere flere terabyte med data.

Ifølge Møllerhaug skal den nye utgaven av søkemaskinen, som kalles AltaVista 97B, være ferdig utbygd i april i år. De fleste av de nye tjenestene er forøvrig allerede tilgjengelige på hovedsiden for AltaVista, mens de distribuerte serverne, inkludert Telias, fortsatt er basert på versjon 97A.

Men det kommer mer. I juni vil Digital begynne testingen av AltaVista 98. Denne er en videreføring av AltaVista 97B, og har en enda mer avansert søkemotor. Blant nyhetene her er blant annet rettskrivningskorrigerende søk. Dette gjør at søkemaskinen gjenkjenner ord på nettsteder som er feilstavet. Brukeren vil dermed også få listet opp disse nettstedene ved et søk.

Det skal også være mulig å søke etter ord man ikke helt vet hvordan staves, men som man kjenner uttalen til.

- Slike såkalte fonetiske eller fuzzy søk gjør at man for eksempel søke etter ord på språk som har stavemåter som skiller seg fra brukerens eget språk, for eksempel fransk i forhold til norsk, forklarer Møllerhaug.

- Hensikten er å finne mer informasjon enn i dag.

Disse utvidelsene av søkefunksjonen i AltaVista vil støtte det norske språket, og vil bli tilgjengelige i september når den fullstendige versjonen av AltaVista 98 blir lansert.

Hovedserveren til AltaVista er plassert i Palo Alto i California. Serveren består av 16 klyngete Alpha-maskiner med til sammen 128 gigabyte med minne. Serveren må likevel stadig utvides.

Det er som kjent mulig for bedrifter og privatpersoner å installere en AltaVista søkemaskin på sitt eget dataanlegg. For privatpersoner er dette til og med gratis. AltaVista Personal, som privatutgaven kalles, kan støtte søk i over 200 forskjellige filformater, inkludert Microsoft Office, PDF og Postscript-filer. Selv brukerens e-postkasse kan indekseres. AltaVista Personal finnes med 23 forskjellige språk.

Også de lokale søkemaskinene vil i forbindelse med AltaVista 97B og 98 få utvidet funksjonalitet og forbedrede egenskaper.

- Blant annet vil det komme bedre sikkerhetsfunksjoner som gjør at man for eksempel i forbindelse med en NT-maskin ikke indekserer filer som brukeren ikke har tilgang til. Det vil være mulig å lage flere indekser, tilpasset rettighetene til de forskjellige brukerne. Da slipper man å få listet opp mange filer som man ikke får åpnet, forteller Møllerhaug.

Det vil også komme et CD-indekseringssett hvor man kan forhåndsindeksere innholdet på en CD-ROM før man brenner inn både innholdet og indeksen på CD-en. Møllerhaug mener dette kan være nyttig når man ønsker å publisere en CD, og samtidig vil ha med en skikkelig indeks over innholdet.

Det finnes en rekke store brukere av AltaVista-programvaren. Møllerhaug nevner spesielt FBIs kriminalitetsdatabase. Dette er en Oracle-basert database med over 40 millioner opptegnelser. Søkehastigheten er blitt mange ganger raskere og søkene enklere å utføre. Et konkret eksempel på dette var et søk etter alle kjente forbrytere som var bosatt innenfor en viss radius fra Baltimore, Maryland.

Før AltaVista ble installert, tok dette søket tre uker. Etter at AltaVista ble installert, var tiden kortet ned til mindre enn fire sekunder.

Til toppen