Navigation path

Left navigation

Additional tools

Tag ‘puheentunnistus’

Mikä on tekoälyn ja käännösteknologioiden nykytilanne?

tiistai, kesäkuu 1st, 2021

Tekstin on kirjoittanut Annalisa Sandrelli, englannin kielen ja kääntämisen lehtori ja EMT-edustaja, tulkkauksen ja kääntämisen maisteriohjelma, Università degli Studi Internazionali, UNINT-ohjelma

Tekstin ovat kääntäneet Turun yliopiston Monikielisen käännösviestinnän tutkinto-ohjelman opiskelijat Miljaana Lahdenperä ja Emmi Korpisalo

Università degli Studi Internazionali (UNINT) ja DGT (Rooman kenttätoimisto) järjestivät yhdessä Translating Europe -työpajan perjantaina 15.1.2021.

Työpajan tavoitteena oli antaa yleiskuva neuroverkkokääntämisen (NMT) ja puheentunnistusteknologioiden viimeaikaisesta kehityksestä. Translating Europe ‑työpaja keskittyi erityisesti siihen, miten käännös- ja tulkkausteknologian uusimmat suuntaukset voivat tukea kielen ammattilaisten työtä ja samalla edistää sekä kielellistä osallisuutta että tiedon, kulttuurin ja viihteen saavutettavuutta yleisölle alati globalisoituneessa monikielisessä yhteiskunnassa (esim. julkisten palveluiden verkkosivujen konekääntäminen, EU:n täysistuntokeskustelujen automaattinen tekstitys jne.) Täten työpaja liittyi temaattisesti Translating Europe -työpajasarjan aiempiin tapahtumiin, ja sen tarkoituksena oli lisätä tietoisuutta kääntämisen yhteiskunnalle luomasta lisäarvosta.

Alun perin kasvotusten järjestetyksi tapahtumaksi suunniteltu työpaja siirrettiin Zoom-alustalle tämänhetkisen koronakriisin takia. Mahdollisimman suuren osallistujamäärän varmistamiseksi tapahtuma oli maksuton, eikä ilmoittautumista vaadittu. Lisäksi se suoratoistettiin Euroopan komission käännöstoimen pääosaston (DGT) YouTube-kanavan Translating for Europe kautta. Työkielet olivat englanti ja italia, ja lisäksi tarjolla oli simultaanitulkkauspalvelu. Puhujina oli mm. tohtoreita, professoreita, lehtoreita ja tutkijoita Italian, Belgian, Saksan, Irlannin ja Yhdistyneen kuningaskunnan yliopistoista, joista useat (esim. UNINT, Dublin City University ja Gent) kuuluvat EMT-verkostoon. Paikalla oli lisäksi alalla työskentelevien johtavien italialaisten yritysten edustajia, jotta voitiin havainnollistaa nykytilannetta ja tuoda esille sitä, mihin näiden aiheiden tutkimus ja tuotekehitys on menossa.

DGT:n pääjohtajan Rytis Martikonisin sekä UNINT:n rehtorin ja tulkkaus- ja käännöstieteellisen tiedekunnan dekaanin esittämien tervehdysten jälkeen ensimmäinen istunto oli omistettu työpajan kahden pääteeman eli kääntämiseen ja tulkkaamiseen sovellettavan neuroverkkokääntämisen ja puheentunnistusteknologian esittelylle. DGT:n konekääntämisen yksikön päällikkö Markus Foti piti esitelmän EU:ssa kehitetyistä sähköisen kääntämisen välineistä. Häntä seurasivat Fondazione Bruno Kessler -säätiön Giuseppe Daniele Falavigna ja Marco Turchi, jotka esittivät lyhyen historiallisen katsauksen automaattiseen puheentunnistusteknologiaan (ASR) ja sen sovelluksiin puheen kääntämiseen sekä tietokoneavusteisen tulkkauksen nykyiseen kehitykseen. Molempia teemoja (NMT ja ASR:n käännössovellukset) käsiteltiin myös yritysten edustajien eli Luca De Franceschin (Translatedin tuotepäällikön) sekä Gorizio Ciancarellin ja Filippo Tessaron (PerVoicen edustajien) esityksissä. Molemmat yritykset ovat kehittäneet valikoiman uusia omia ohjelmistoja ja ovat mukana useissa tutkimusprojekteissa, joista osa esiteltiin ensimmäistä kertaa työpajan aikana.

Ammattimaisessa kääntämisessä yleisesti käytettävään konekääntämiseen liittyy vahvasti jälkieditointi. Tämä oli Moritz Schaefferin (Mainz-Germersheim) ja Federico Gasparin (Università per Stranieri ”Dante Alighieri”) ajatuksia herättävien esitysten aiheena. Virheentunnistus jälkieditoinnissa on erityisen tärkeää käytettäessä NMT:tä, jonka tuottama käännös on yleensä hyväksyttävä pintatasolla, mutta voi itse asiassa sisältää monenlaisia virheitä. Lisäksi käsiteltiin useita konekääntämisen laadunarviointimittareita.

Ansaitun lounastauon jälkeen Joss Moorkens (Dublin City University) avasi iltapäiväistunnon esityksellänsä avustavan käännöstyökalun eli helppokäyttöisen käännösliittymän suunnittelusta ja kehittämisestä. Samoin Claudio Fantinuoli (Mainz-Germersheim) ja Bart Defrancq (Gent) kuvailivat hankettaan kehittää ASR-pohjainen työkalu, joka on suunniteltu auttamaan simultaanitulkkeja tulkkauskopissa.

Kysymys koneiden integroimisesta kääntämisen ja tulkkauksen työnkulkuun on tämän hetken toinen keskustelunaihe. Claudio Fantinuoli ja Bianca Prandi (Mainz-Germersheim) kuvailivat kokeellista tutkimusta, jossa ihmisen tekemää simultaanitulkkausta verrataan puhetta kääntävän kääntimen tuotokseen, kun taas Elena Davitti ja Tomasz Korybski (Surrey) esittelivät SMART- ja MATRIC-projektit, joissa vertaillaan erilaisia puheen kääntämisen työnkulkuja. SMART keskittyy täysin ihmisen tekemään kieltenväliseen sanelutekstitykseen, kun taas MATRIC vertaa simultaanitulkkausta sellaiseen automatisoidun työnkulun tuotokseen, joka koostuu sanelutekstityskomponentista (samalla kielellä) ja konekäännöskomponentista. On selvää, että on olemassa laaja valikoima mahdollisia työnkulkuja, joissa erilaiset (puhujasta riippuvaiset tai riippumattomat) puheentunnistusjärjestelmät ja konekäännöstyökalut voidaan integroida tuloksekkaasti avustamaan ammattitulkkeja ja -kääntäjiä tiettyihin tarkoituksiin, ja että aihepiiriä on vasta hyvin vähän tutkittu.

Tapahtuma oli erittäin mielenkiintoinen ja herätti innostusta osanottajissa sekä keräsi paljon huomiota: tapahtumaa seurasi 380 Zoom-osallistujaa aamulla ja 260 iltapäivällä sekä paljon enemmän suoratoiston kautta YouTubessa, mikä osoittaa kiinnostusta keskustelun aiheita kohtaan. Jos et pystynyt osallistumaan työpajaan, voit lukea lisää puhujistamme ja ohjelmastamme alla olevalta tapahtuman verkkosivulta ja katsoa YouTubesta englanninkieliset tallenteet, jotka ovat helppokäyttöisyyden vuoksi saatavilla 3 erillisessä osiossa.

Tapahtuman verkkosivu, josta löydät ohjelman, tiivistelmät ja tietoa puhujista (englanniksi ja italiaksi): https://www.unint.eu/it/calendario-eventi/translating-europe-workshop-2021.html 

Tekoäly ja käännösteknologiat – osa 1: neuroverkkokääntäminen 

Tekoäly ja käännösteknologiat – osa 2: jälkieditointi ja lokalisointi

Tekoäly ja käännösteknologiat – osa 3: tekoäly ja tulkkaus

Odotamme innolla palautettasi, kommenttejasi ja kysymyksiäsi, jotta voimme ylläpitää keskustelua asiasta.

Aiheet

EMT map 2019-2024