Finns det någon diktafon som kan översätta till punktskrift?

Det du frågar efter är vår framtidsdröm – en liten maskin som automatiskt omvandlar tal till text som i sin tur an läsas i till exempel punktskrift.

Rent teoretiskt finns även denna pryl redan. Det går att använda röststyrnings-funktioner och -appar i smarta telefoner eller datorer, och dessa omvandlar tal till text som sedan kan läsas på en punktdisplay med hjälp av en skämläsare.

Siri och Dragon Dictation

Du kan till exempel ta en iPhone, köra VoiceOver med en punktdisplay till den och tala in text till Siri eller den något bättre appen Dragon Dictation. Då går det från tal till punktskrift!

Det finns – eller har i alla fall funnits – diktafoner som haft en medföljande programvara som kunde tolka ljudfilerna man spelat in till text när man förde över det till datorn. Och har man väl fått över ljuden till text i datorn går det naturligtvis att skriva ut dem i punkt eller läsa direkt på en punktdisplay.

Bara vid optimala förhållanden

Men… Detta gäller tyvärr bara om vi utgår från optimala förhållanden, som en person helt utan dialekt som uttalar varje stavelse tydligt, inte har några kringljud och dessutom ser att korrigera när tolkningen blir fel.

Om personen som överför från diktafonen till datorn eller telefonen, är fullt seende kan den personen troligen korrigera felen snabbare än det är att skriva in texten från början.

Men om vi utgår från att en person med dövblindhet självständigt ska kunna hantera hela förloppet från diktafon till punktskrift är svaret idag att det tyvärr inte kommer att fungera tillfredställande.

Problemet är att resultatet av tolkningen är för dålig när vi pratar svenska. Det hjälper inte att kunna få ut det i punktskrift om texten inte stämmer med det som verkligen sagts på diktafonen.

Amerikanska fungerar bäst

Röstigenkänning för amerikanska fungerar bäst – speciellt de system som man kan träna upp på sin egen röst och dialekt. Där finns program som inte bara tolkar ljudet utan också använder språkkunskap om meningsbyggnad, vilka ord som ofta kommer efter varandra och så vidare.

Tänker framför allt på Dragons program där det bästa är uppe i 96% rätt vid dikteringstester. Men – då gäller det när man sitter med en bra mikrofon i ett för övrigt tyst rum, har en väl intränad röst i programmet och som sagt pratar en bra amerikanska.

4% fel rätt mycket

Även på denna nivå blir alltså 4% fel, vilket är rätt mycket om man inte manuellt korrekturläser hela texten. I en text som denna på drygt 500 ord skulle över 20 ord vara fel, och då kan informationen bli helt felaktig.

Det kan också vara svårt att korrekturläsa med talsyntes eftersom de feltolkade orden troligen är ord som låter ungefär likadant som det rätta orden.

Vi har ett exempel på svenska när ordet ”betoningen” skrevs som ”betongen”. Varken genomläsning med talsyntes eller rättstavningskontroll upptäckte felet. Han som hade läst in det visste vad han sagt och hörde ”betoningen” även om talsyntesen säkert sa ”betongen”. Men för mottagaren av meddelandet blev det fullständigt förvirrat…

Kommendering går bra

Det finns idag inbyggd röstigenkänning på svenska i både iPhone och Android-telefoner. Dessa kan man inte träna till sin egen röst, utan man förväntas prata på hyfsad rikssvenska.

Vår erfarenhet är att det går bra till kommendering av telefonen, t ex ”Sätt timer 2 minuter” eller ”Ring Kalle”, men om man vill använda det till att skriva ett SMS kan det bli en hel del fel som också kan vara svåra att upptäcka om man ser dåligt.

Och är man i en bullrig eller stökig miljö, som på en buss eller tåg, eller har radion på, fungerar inte ens kommenderingen.

Lovande teknik

Vi har i många år trott att detta SNART kommer att fungera bra på svenska. Första systemet för persondator testade vi redan på 80-talet, och det är onekligen en fantastiskt lovande teknik, framför allt för personer med hörselskador eller dövhet.

Vi ska alltså fortsätta följa utvecklingen mot en automatisk och perfekt översättning från tal till text – men idag är även de mest avancerade systemen inte tillräckligt bra för att använda i vardagsmiljöer och med olika dialekter och röster på svenska.