Dikterende miljøer bruker talegjenkjenning først

Mens Nordisk språkteknologi strir med konkursspøkelset, arrangerte Max Manus et todagers seminar for blant annet å legge fram praktiske erfaringer fra sine norske talegjenkjenningssystemer. Max Manus spådde i våres at 2003 ville bli et gjennombruddsår for norsk talegjenkjenning. Skal man dømme etter erfaringene fra en håndfull sykehus der systemene har vært brukt gjennom flere måneder, kan det synes som om målet er nådd.

Les også:

[07.12.2006] Ahus-leger taler journaler rett inn på data
[27.02.2004] Microsoft taleserver foreløpig bare for USA
[13.01.2004] Blinde får lest opp nettet
[12.12.2003] Felles angrep mot helsesektoren
[29.10.2003] Microsoft vil lansere talestyring for PDA-er
[27.10.2003] NTNU satser 40 millioner på språkteknologi
[20.10.2003] Vil slå Nordisk Språkteknologi konkurs
[04.03.2003] Gjennombruddsår for norsk talegjenkjenning

Det er en kjent erfaring at teknologi sjelden får gjennomslag for sin egen skyld. For Max Manus, og for opphavet til teknologien som selskapet benytter i sine systemer, den nederlandske giganten Philips, dreier det seg følgelig om å finne fram til miljøer der talegjenkjenning kan bidra til å effektivisere eksisterende arbeidsrutiner. Derfor starter man med miljøer der avskriving av tale er en arbeidskrevende oppgave, og der man kan vente en gevinst ved å erstatte manuell avskrift med et program som skriver ned det som blir sagt. Slike miljøer finnes for eksempel i sykehus. Max Manus valgte å satse på røntgenavdelinger der bildebehandling og diktering allerede er digitalisert, og der automatisert overføring av tale til tekst var en savnet lenke. Sykehus i Drammen, Kongsberg, Vestfold, Rogaland og Ringerike er blant dem som lot seg overtale til å prøve.

– Hos oss hadde vi etablert digital diktering før vi tok i bruk talegjenkjenning, fortalte radiolog Carsten Brocker ved Ringerike sykehus til seminaret. – Philips leverte teknologien, Max Manus med finansiering og prosjektering. Max Manus bidro dessuten med stemmedugnad, for å utsette systemet for norsk tale fra alle slags dialekter. Vi hentet terminologidatabase fra flere sykehus. Det er viktig å spre dette fordi radiografiske avdelinger gjerne har sine lokale ordbrukstradisjoner.

Målet som var formulert for talegjenkjenningsprosjektet var enkelt: Det skulle være til hjelp for skrivetjenesten, uten å gripe inn i etablerte rutiner. Seinere ble dette spontant endret til noe mer i retning "uten å gripe for mye inn i etablerte rutiner".

– Arbeidet med stemmejakt og terminologidatabase begynte våren 2000. I november 2002 begynte én lege å diktere til talegjenkjenningssystemet på prøvebasis. I mars 2003 ble det tatt i bruk av flere, og siden mai har alle unntatt vikarer brukt det daglig.

Rutinen er som følger: Radiologen ser på røntgenbildet, og dikterer sine observasjoner. Så kvernes tale til tekst, og en sekretær eller en radiolog leser korrektur. Et teknisk problem har hittil gjort at radiologen ikke kan se teksten umiddelbart. Dette har med integrering i det helhetlige bildesystemet å gjøre, og har vært løst ved andre sykehus. Straks teksten er "preliminært" godkjent, er det tilgjengelig på det interne nettet for alle legene ved sykehuset. Når bildet og teksten er kontrollert og godkjent av en annen radiolog, får teksten status "signert". Da kan den skrives ut og sendes til rekvirent.

– Det var et mål da systemet ble installert, at feilraten, det vil si andelen ord som ikke ble korrekt gjengitt, ikke skulle overstige ti prosent. I praksis er det langt bedre enn det: Bare fem av hundre ord blir ikke gjenkjent, og systemet har vist seg lærenemt.

Det er et moment her at flere av røntgenlegene er innvandrere, og har ikke norsk som morsmål.

– Jeg er tysk, og arbeidet flere år i Danmark før jeg kom til Norge. Av de fire andre er det en tysk radiolog til, en polsk som kom til Norge via Sverige, og en bulgarsk som snakker med kraftig aksent. Jeg er kommet ned i en feilrate på 4,56 prosent. Den norske legen er nede i 2,33, og den nye tyske legen har 3,32 i sin første måned.

Artikkelen fortsetter etter annonsen

annonsørinnhold

– Vi har vår egen ChatPwC som kjører lokalt. Vi deler derfor ingen informasjon ut av huset

Et spesielt tilfelle er en dansk radiolog som arbeider i Ringerike hver femte uke.

– Systemet greide å venne seg til ham også, selv om han snakker dansk. Det han dikterer, kommer ut på norsk.

Av de 10.000 diktatene som er registrert fra mars til september, har hele 39,7 prosent kunnet godtas uten endringer i forhold til det talegjenkjenningen leverte. Bare 23,8 prosent av tekstene hadde flere enn ti prosent feil.

– Vi har hatt målbare gevinster av talegjenkjenningen. Før tok det gjerne en dag fra bildene ble tatt til teksten var klar. Nå tar det under fire timer. Vi har fått 24 timers skrivetjeneste, også i helgene. Vi har ferdige tekster til morgenmøte med kirurgene, det var ikke mulig før. Ved spesielle behov kan vi ha teksten ferdig i løpet av fem minutter og sende bilde og tekst av gårde sammen med pasienten når situasjonen er akutt og krever overføring til et annet sykehus.

Av en eller annen grunn hadde ikke klinikerne i sykehuset oppfattet av radiologene hadde tatt i bruk talegjenkjenning.

– De var litt overrasket når vi spurte om de hadde merket noen endringer hos oss. Så kom det fram at de hadde snakket om at tekstene kom raskere. Det har ført til hurtigere oppdatering av journaler, tidligere beslutning om behandling og kortere liggetid for pasientene. Dette merkes spesielt godt i helgene. Talegjenkjenning har bidratt til bedre samarbeid med kirurger og indremedisinere.

For skrivetjenesten har effektiviseringen frigjort halvannet av fire og et halvt årsverk.

– Talegjenkjenningen har altså ført til en intelligent omfordeling av ressurser. Sekretærene klager ikke, selv om det kan tenkes at noen frykter for jobben.

Artikkelen fortsetter etter annonsen

annonse

På trappene til internasjonal suksess

Brocker slår fast at han ikke ønsker å arbeide på et sted som ikke har talegjenkjenning. Det eneste han virkelig har å klage på, er at serveren fortsatt går i stå to til tre ganger i uka.

– Det fører ikke til tapte data, og det er fort gjort å få maskinene i gang igjen.

Max Manus mener årsaken kan være mangelfull tilpasning til de øvrige systemene, og at installasjonen bør gjennomgås på nytt for å bedre stabiliteten.

Dikterende miljøer bruker talegjenkjenning først

Norske radiologer sier de har gode erfaringer med talegjenkjenning fra Max Manus.