Fast leter igjennom nesten hele Internett

Etter å ha ligget bak en stund, er det igjen den norske søkemotoren alltheweb.com som lar deg lete på flest Internett-sider.

Tre-fire søkemotorer konkurrerer om å gi deg full oversikt på Internett. Men antallet sider på Internett vokser stadig raskere. Norske Fast lover likevel at de skal hente inn igjen forspranget.

Inntil i går ledet Inktomi og Google kappløpet med søkemotorer som lot deg lete igjennom 500 millioner Internett-sider.

- Vi har vært opptatt med å bygge opp serversentere i London og har havnet litt bak. Men nå har vi lansert en ny indeks med 575 millioner sider, forteller John M. Lervik, teknologisjef hos Fast til digitoday.no.

- Fast dekker nå veldig store deler av Internett. Vi tror det finnes rundt 2,5 milliarder sider der ute og vi har lett igjennom 1,7 milliarder av dem. Etter å ha sortert ut duplikater, datafiler og annet rot, sitter vi igjen med 575 millioner sider, forteller Lervik.

Fast har tidligere lovet at deres søkemotor vil la deg lete igjennom en milliard nettsider innen neste sommer. Selskapet kom sent med i kappløpet mot Altavista og de andre store søkemotorene, men er nå helt i teten med 12 millioner søk om dagen.

Lervik understreker at kampen mellom søkemotorene hardner til etter hvert som antallet sider øker. Egentlig er oppgaven umulig, påpeker Lervik.
- Ideelt sett skulle vi hatt en søkemotor som var oppdatert med selv en minutt gamle Internett-sider og som alltid forstod hvilke dokumenter du var mest interessert i, sier Lervik.

Fast-sjefen forteller at det største hinderet er ikke deres teknologi eller serversentere, men innholdsserverne på Internett.

- Vi og andre søkemotorer ville overbelaste serverne ute på nettet totalt dersom vi gikk inn så ofte som vi ideelt trenger, forteller Lervik.

Et annet problem er at dagens søkemotorer, inkludert Fast, behandler alle spørsmål likt, til tross for at spørsmålene leter etter forskjellige typer dokumenter. Dette gjør at svarene ikke blir optimale.

Lervik forteller at Fast mener spørsmålene brukerne stiller kan deles opp i vanlige/enkle (leter etter Internett-adressen til Opticom), veldig spesifikke, men enkle (Internett-siden til en bekjent) og kompliserte/sammensatte (sammenligning av Intel og AMDs prosessorer).

De forskjellige typene spørsmål ønsker forskjellig sortering av treffene. For eksempel ønsker ikke en som søker etter sammenligninger av Intel og AMD masse lenker til hver av de to selskapenes Internett-sider - de kjenner vedkommende trolig til. Fast arbeider derfor med teknikker som kan takle slikt.

Lervik nevner også andre teknologier Fast arbeider med. Blant annet forsker selskapet på språkteknologier som kan analysere innholdet av Internett-sider for bedre sortering. Selskapet ser også på teknikker som kan hjelpe dem i å sortere ut viktige og ofte oppdaterte sider som bør indekseres oftere.

Til toppen