Spår massekonvertering til XML

Microsofts nye åpne format vil utløse en global omformatering av dokumenter, sier XML-guru Jean Paoli.

Den sentrale XML-guruen i Microsoft de siste ti årene, Jean Paoli, har vært i Norge for å orientere presse og eksperter om selskapets nye åpne dokumentformat Office Open XML (for anledningen forkortet til OOX). Paoli var dypt engasjert i SGML da han i 1995 ble hyrt inn for å være med på å utvikle Internet Explorer. Siden har han vært en av interoperabiliteten og åpenhetens sterkeste talspersoner innad i Microsoft, sier han selv.

    Les også:

– Vi diskuterte allerede da at html ikke var bra nok, og at målet var å få til noe som kunne bevege data over Internett. Jeg har siden vært med på XML-arbeidet i W3C, og på å føre XML-bevegelsen i Microsoft. I dag er jobben min å definere Microsofts helhetlige XML-arkitektur.

Et av Paolis avgjørende gjennomslag kom med lanseringen av Office 2003, Microsofts første kontorsuite med støtte for XML. Med neste utgave, Office «12» som kommer en gang neste år, skal Microsoft ta skrittet fullt ut og gjøre XML-formatet OOX til standard format.

– Overgangen fra de binære standardformatene i Office til åpne XML-formater utgjør en avgjørende endring. Hittil har dokumenter vært ugjennomsiktige klumper. Det holder ikke når behovet er å kunne forholde seg til innholdet, bruke det i en prosess og gjenbruke informasjonen.

For tjue år siden var et dokument noe man skrev ut, mener Paoli. I dag skal dokumenter inngå i arbeidsflyt. De må kunne automatisk hente og avlevere informasjon fra en rekke forskjellige systemer.

– Med de gamle lukkede, binære formatene, var dette umulig. Med et XML-format, kan dokumentene formidle informasjon, også til andre systemer og plattformer.

For over ti år siden, kunne Microsofts dokumentformater endre seg hver gang tekstbehandleren eller de andre verktøyene ble oppdatert, og når Word 6 etterfulgte Word 2, var det ingen mulighet å lese Word 6-dokumenter med en ellers fullt ut funksjonell Word 2. I dag er Microsofts holdning stikk motsatt.

– Vi ser for oss at vi står foran verdens mest storstilte omformatering av dokumenter. Vi må være sikre på at overgangen for våre kunder blir så enkel som mulig. Derfor vil vi legge ut gratis oppdateringer til tre tidligere utgaver av Office, det vil si 2000, XP og 2003, slik at det skal bli mulig for alle å lese og skrive til XML-formatet. Oppdateringen skal ikke bare gjøres gratis, men vi arbeider med å finne fram til hvordan det kan gjøres så enkelt som mulig for brukerne.

Paoli lover også et gratis verktøy som ved ett slag skal kunne konvertere mapper med hundrevis av dokumenter i binære formater fra Word, Excel og Powerpoint, til de nye XML-formatene. Han legger til at de som vil, fortsatt skal kunne holde seg til binærformatene.

Av hensyn til behovet for rask gjenkjennelse, består etternavnet til OOX-formatene av det opprinnelige etternavnet, tilføyd en «x». XML-formatet til Word blir følgelig docx, til Excel xlsx, til Powerpoint pptx. XML-formatene skal ikke inneholde makroer. Dokumenter med integrerte makroer får følgelig en annen betegnelse, med «m» i stedet for «x» på slutten. Eksempler er docm for tekst, xlsm for regneark.

– Teoretisk sett skulle det med XML ikke lenger være behov med en én til én tilordning mellom applikasjoner og formater. Burde det ikke være slik at man brukte applikasjonen som passet best til et bestemt formål, men at alle dokumenter kunne la seg åpne og redigere av enhver applikasjon?

– Det er teoretisk mulig, men det er et sprang vi ikke ville gjøre, i hvert fall ikke i denne omgang. Våre primære hensyn har vært å gjøre overgangen så enkel som mulig for kundene, og sikre at absolutt alle egenskapene fra de binære dokumentene bevares ved overgangen til XML. Når du lagrer et regneark i XML-formatet, skal ingenting går tapt. Det innebærer en én til én konvertering av absolutt alt, også pivottabeller, animeringer, grafiske dataframstillinger, stilsett og smarte tagger, bare for å nevne noe. Vi har 400 millioner bruker med mange milliarder dokumenter. Vi kan ikke bare snu oss på et blunk.

For Paoli og for Microsoft, er mangfoldet av funksjonalitet i de nye formatene en viktig differensiator i forhold til det konkurrerende OpenDocument Format (ODF) fra Oasis som brukes i OpenOffice.org, Sun StarOffice og snart også i IBM Workplace.

– Poenget med ODF var å bevare egenskapene i StarOffice. Våre binære formater er langt rikere. Derfor er også våre XML-formater langt rikere. Samtidig vil vi gjennom standardiseringsprosessen i Ecma International, og deretter ISO, sørge for at våre formater kan distribueres, tillempes og brukes etter nøyaktig de samme prinsippene som ODF.

Til toppen