Side 4 og 5 i manuskriptet viser vakker håndskrift og kryptiske tegn. Da prosjektet startet visste ingen med sikkerhet hvilket språk Copiale var skrevet på.

Berømt manuskript endelig dekryptert

Budskapet i det 105 sider lange Copiale-sifferet skal nå kunne tydes.

Forskere ved University of Southern California og Uppsala universitet har gått sammen om et prosjekt for å dekryptere et håndskrevet manus på 105 sider som antakelig ble skapt en gang mellom 1760 og 1780, kjent som the Copiale cipher.

Manuskriptet er vakkert innbundet, uten tittel.
Manuskriptet er vakkert innbundet, uten tittel.

Manuskriptet er vakkert innbundet i grønn brokade. På de 105 sidene er det skrevet til sammen rundt 75 000 tegn. Bortsett fra to notater på henholdsvis andre («Philipp 1866») og siste side («Copiales 3»), er alt skrevet i kryptisk notering med 90 ulike symboler. Symbolene omfatter alle latinske og greske bokstaver, samt diakritiske tegn og abstrakte tegn.

Dekrypteringen av manuskriptet har vært en prøvestein på bruk av statistisk språkprosessering for å tyde gamle tekster. Arbeidet knyttes til prosjektet Decipher ved University of Southern California, der det pekes på at målet også er å finne fram til treningsmetoder for systemer for automatisk oversettelse, uten tilgang til parallelle tekster.

Denne typen tilnærming knyttes til en amerikansk matematiker, Warren Weaver (1894–1978), kjent som en pioner innen maskinoversettelse. Weaver tilhører samme generasjon som Norbert Wiener (kybernetikkens far) og Claude Shannon (informasjonsteoriens far), som han også samarbeidet med. Han var medforfatter med Shannon av den banebrytende boka The Mathematical Theory of Communication (1949, Urbana: University of Illinois Press).

I et brev til Wiener i 1947 skrev Weaver:

One naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say: ‘This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode.’

Ideen er altså at en tekst på et språk man ikke kjenner, kan oppfattes som en kryptert versjon av teksten på et språk man kjenner.

Arbeidet med å dekryptere Copiale-manuskriptet startet med å tilordne hvert av de 90 tegnene en sekvens av ett til fem vanlige bokstaver, skanne manuskriptet og gjøre det tilgjengelig for maskinanalyse.

Den første utfordringen var å finne ut hvilket språk manuskriptet faktisk var skrevet i.

Her ga etablerte metoder ingen entydig svar, bare en antakelse om at tysk kunne være mer sannsynlig enn andre språk. Siden manuskriptet stammer fra Tyskland, og siden eieren antakelig var tysk, utfra den avsluttende doble p-en i «Philipp», bestemte de seg for å angripe teksten videre som om den skulle være på tysk.

Etter flere typer statistisk kverning, skjønte de at alle de ulike latinske bokstavene i manuskriptet hadde samme funksjon: De var mellomrom. En annen finesse ved krypteringen er at et eget tegn ble brukt til å indikere en gjentakelse av forrige tegn. Forskerne oppdaget videre at flere tegn ble brukt til å erstatte hyppig forekommende av sekvenser på to og tre bokstaver på tysk. Et lite kors sto for eksempel for «sch».

Etter hvert fikk de tilordnet en funksjon til hvert av de 90 brukte tegnene i manuskriptet, bortsett fra åtte store symboler. Det antas at disse er logogrammer, som viser til spesielt betydelige individer, organisasjoner eller funksjoner.

Dekrypteringen viser at Copiale beskriver initieringen av en kandidat i et hemmelig samfunn, siden identifisert som «Oculist-ordenen».

Fra nettstedet the Copiale Cipher er det lenker til bilder av hvert oppslag i manuskriptet, samt til en side-for-side oversettelse til engelsk.

I en eller annen fjern framtid vil man kanskje ha dataprogrammer som kan kverne denne typen krypterte tekster uten annet forarbeid enn skanning. Arbeidet med Copiale understreker hvor fjern denne framtiden er.

Til toppen