Obama bytter ut Robots.txt

Teknologene gleder seg over at den nye presidenten åpner for søkemotorene.

Obama bytter ut Robots.txt

Teknologene gleder seg over at den nye presidenten åpner for søkemotorene.

Barack Hussein Obama gikk til valg med "Change" som slagord, og et av de første merkbare endringene etter at han ble president er at hans stab har endret på filen som avgjør hva søkemotorene kan indeksere på Whitehouse.gov.

Robots.txt er en enkel tekstfil som spesifiserer hva søkemotorene får lov til å indeksere på et nettsted. Det er ikke obligatorisk å følge retningslinjene her, men i praksis gjør alle de store det, og det er for eksempel ikke mulig å sette opp Google Custom Search til å ignorere retningslinjene.

I utgangspunktet er Robots.txt et hjelpemiddel som sørger for at ikke søkemotorene indekserer uinteressante sider som kan rote til søkeresultatene, men den brukes også til å stoppe søkemotorene.

Det gjøres for eksempel av Brønnøysundsregisteret og av Telefonkatalogen.no. Dermed må man bruke nettstedets egen søketjeneste, istedenfor at alt blir tilgjengelig fra hvilken som helst søkemotor.

En tilsvarende tilnærming ble valgt av Bush og hans stab, mens Obama har gått bort fra dette.

Ifølge Kottke.org så den slik ut dagen før Obama ble president:

User-agent: *

Disallow: /cgi-bin

Disallow: /search

Disallow: /query.html

Disallow: /omb/search

Disallow: /omb/query.html

Disallow: /expectmore/search

Disallow: /expectmore/query.html

Disallow: /results/search

Disallow: /results/query.html

Disallow: /earmarks/search

Disallow: /earmarks/query.html

Disallow: /help

Disallow: /360pics/text

Disallow: /911/911day/text

Disallow: /911/heroes/text

(Oppdatert: den fortsatte slik med hele 2400 linjer)

Slik ser den ut nå:

User-agent: *

Disallow: /includes/

Til manges glede har Obama også valgt en fri Creative Commons-lisens for innholdet på Whitehous.gov:

Except where otherwise noted, third-party content on this site is licensed under a Creative Commons Attribution 3.0 License. Visitors to this website agree to grant a non-exclusive, irrevocable, royalty-free license to the rest of the world for their submissions to Whitehouse.gov under the Creative Commons Attribution 3.0 License.

Dette betyr at hvem som helst kan bruke innholdet til hva de vil, så lenge de krediterer at innholdet kommer fra Whitehouse.gov.

Samtidig må Creative Commons-lisensieringen ses på som en symbolsk handling, ettersom offentlig informasjon fra regjeringen uansett ville vært tilgjengelig.

Til toppen