Många av oss är bekanta med Google Translate, översättningsappar på mobilen för resor samt olika bruksanvisningar för apparater eller prylar. I dem har man använt sig av maskinöversättning.
Även professionella översättare använder maskinöversättare som hjälpmedel. För att lära en maskinöversättare att översätta ett visst språkpar krävs miljontals meningar eller miljarder ord text. Forskardoktor vid Helsingfors universitet Maarit Koponen forskar i de feltyper som maskinerna gör och som leder till missförstånd samt hur missförstånden skulle kunna identifieras.
En maskinöversättare består av algoritmer
Inlärningsalgoritmerna bakom maskinöversättning kallas artificiell intelligens, men en maskin är inte intelligent på samma sätt som människan eller de superutvecklade artificiella intelligenser som figurerar i science fiction-filmer.
– Ett översättningssystem hanterar teckensträngar, berättar Maarit Koponen.
Det finns många olika system, men alla grundar sig på en liknande algoritm. Aktuellt inom maskinöversättningsforskningen just nu är neurala nätverk (neural network), system som består av vissa typer av inlärningsalgoritmer på flera nivåer. Man matar in text i systemet och algoritmen omvandlar texten i numeriskt format. På det sättet lär sig algoritmen vilka kontexter som orden förekommer i.
– Man har uppnått överraskande bra resultat med systemen med neurala nätverk: på några år har kvaliteten på maskinöversättningar förbättrats enormt.
Små språk omfattas inte av maskinöversättning i lika stor utsträckning som de större språken: kvaliteten är oftast bättre när den ena halvan i språkparet är engelska, eftersom det finns så mycket material på engelska att träna maskinen med.
Enligt Maarit Koponen har man mest arbetat med att lära maskinöversättare att översätta skriven text. Samma teknik kan dock också tillämpas på talöversättning. Här kommer taligenkänning in i bilden. Först omvandlas talet till text, sedan översätts texten och till sist omvandlas texten tillbaka till tal.
Hur är det med visuellt berättande, skulle det kunna maskinöversättas? I det projekt som Koponen arbetar inom undersöks just detta.
– Vårt mål är att även tillämpa maskinöversättning på visuell information, rörelser och berättelser: först ska maskinen skapa en verbal beskrivning i form av en berättelse av innehållet i en video. Sedan ska man kunna maskinöversätta denna beskrivning till olika språk. Ingen liten utmaning!
En maskinöversättare är ett hjälpmedel
Maarit Koponen anser att det finns två huvudperspektiv när det gäller fördelarna med maskinöversättning: professionell översättning och ökad tillgänglighet.
– I Finland använder sig professionella översättare av maskinöversättning bara i liten utsträckning eftersom maskinöversättare till finska inte håller särskilt hög kvalitet. Internationellt är arbetssättet med maskinöversättare emellertid redan etablerat och blir vanligare även hos oss. Maskinöversättning effektiviserar arbetet: om maskinens version är så bra att man kan få färdig text genom att korrigera den kan den användas som underlag. På det sättet kan man översätta snabbare och i större mängder.
Maskinöversättning lämpar sig väl för att förbättra tillgängligheten och informationssökningen på internet: den mängd information som finns på nätet går inte att hantera av människor.
Maskinöversättning lämpar sig väl för att förbättra tillgängligheten och informationssökningen på internet.
– Även om maskinen gör en felaktig översättning ger den ändå information till människor som annars inte skulle ha haft tillgång till den på grund av språkbarriären, påpekar Maarit Koponen.
Rundradion, Koponens samarbetspartner i hennes aktuella forskningsprojekt, intresserar sig för hur man skulle kunna använda maskinöversättning för att göra program tillgängliga även för de människor som förstår varken finska eller svenska. För statsförvaltningen skulle det vara viktigt att underlätta produktionen av översättningar mellan finska och svenska. För att kunna träna upp en maskinöversättare skulle man dock behöva mer digitaliserat material med detta språkpar.
Alla texttyper bör inte maskinöversättas
Maskinöversättning lämpar sig inte för alla texttyper eftersom texter har olika funktioner.
– En maskin kan ju i princip översätta vad som helst, men det är kanske ingen mening med det, konstaterar Maarit Koponen.
En maskinöversättare lämpar sig bäst för facktexter. Den klarar av korta meningar, okomplicerat språk och entydig terminologi. Man har testat att köra världslitteraturens klassiker genom en maskinöversättare. Enligt Koponen har resultaten inte varit bra.
En maskinöversättare lämpar sig bäst för facktexter.
– Den som läser skönlitteratur är inte ute efter informationsinnehåll, utan estetiska värden och stämning. Litteraturen beskriver och berättar mellan raderna. En maskinöversättare kan endast hantera ord och förstår inte den vidare kontexten eller dolda meningar.
En annan texttyp som inte kan översättas ytligt endast som ord är reklam. Vill man nå ut till en ny marknad måste man tänka efter vad det är man marknadsför och på vilket sätt, vilka kulturella innebörder reklamen får och hur målgruppen ska tilltalas.
Maskinen uppfann spiralalgen
Med exempelvis enhetlighet som kriterium kan en välfungerande maskinöversättare hävda sig som översättare gentemot en människa. Terminologin förblir enhetlig, medan översättningen gjord av en människa kan ha mer variation. Enligt Maarit Koponen fungerar maskinerna ännu inte på det sättet.
– Maskinöversättare kan inte heller nödvändigtvis hantera stavfel eller obekanta ord. Ett neuralt nätverk kan använda sig av de vektorer det skapat och söka efter liknande ord, ibland även hitta på nya: en maskin som inte kände till ordet ’spirulina’ utvecklade motsvarigheten ’kierulevä’ på finska [ungefär spiralalg på svenska].
Även om översättningen av vissa texttyper, till exempel bruksanvisningar, går framåt och trots att maskinöversättning kräver att översättare lär sig nya arbetssätt kan människan inte ersättas helt.
Den mänskliga nivån är en definitionsfråga
Maarit Koponen har ett praktiskt förhållningssätt till påståenden om att kvaliteten på maskinöversättningar ligger på människans nivå: först måste man definiera vad som menas med kvalitet.
Det finns inget enormt språng att förvänta vad gäller kvaliteten på maskinöversättningar.
Dessa påståenden har framförts av många, men enligt Koponen härstammar de ursprungligen från en forskningsartikel som publicerades av Google 2016. I undersökningen jämförde utvärderarna översättningar gjorda av en människa respektive maskin och använde en bestämd skala för att bedöma till vilka delar maskinens version liknade människans.
– Man samlade alltså skalbedömningar av lösryckta meningar utan kontext och fastställde översättningens nivå utifrån detta. Utformningen av undersökningen var problematisk: bedömarna var inte professionella översättare, utan bestod av frivilliga som valts ut genom crowdsourcing. Därmed vet man inget om deras förmåga att bedöma översättningar. Dessutom påverkades bedömningen inte så mycket av betydelsen, utan snarare hur flytande översättningen var: i en lösryckt textsnutt märks det inte nödvändigtvis om den saknar mening, bara maskinens version flyter bra. Det fanns även andra metodologiska problem med utformningen av Googles studie.
Enligt Maarit Koponen finns det inget enormt språng att förvänta vad gäller kvaliteten på maskinöversättningar.
– Man gör små förbättringar och löser vissa problem. Till exempel försöker man åtgärda den könsbias som finns i Google Translate och andra maskinöversättare. Något man också ständigt brottas med är ordens flertydighet och utmaningarna med kontext. Om inte människor nödvändigtvis alltid förstår nyansskillnader, gör inte maskinerna det heller.
Men endast en människa kan utöver orden också översätta det man försöker säga.
Läs merSpråkgranskningsprogram hjälper små språk att överleva