Umělá inteligence a strojový překlad se dostaly do centra obecného zájmu

24. 10. 2023 Hana Saitzová Žádné komentáře

Vášnivé debaty a odborná pojednání neberou konce. Co platilo před půl rokem, je dnes dávno překonané. V následujícím příspěvku se věnuji výlučně praktickým otázkám kvality současného strojového překladu z pohledu člověka, který jako aktivní překladatel a později majitel překladatelské agentury celou profesní dráhu zasvětil překladům a překladatelům.

Záměrně nechávám stranou otázky zachování důvěrnosti informací, hrozbu zneužití dat svěřených překladači a otázky související s právní přípustností a etikou využití strojového překladu pro různé typy dokumentů.

Moderní strojové překladače pracující s velkými jazykovými modely (LLM) se z pohledu běžného uživatele stále méně podobají počítačovým programům, jak jsme je znali ještě nedávno, a pozvolna získávají vlastnosti svých lidských kolegů.

Rychlost moderních překladačů je fascinující, stejně jako zásadní zlepšení kvality přeloženého textu. Načítáním obrovského množství textů se tyto programy dokážou učit a zlepšovat. Umí se dokonce samy učit gramatiku a projevovat přitom nemalou dávku inteligence. Věty a celé texty vytvořené překladačem mají propracovanou stavbu, vypadají věrohodně, a dokonce do značné míry odpovídají i odbornému zaměření původního textu. Ale pozor, zdání často klame! Stroj totiž zpravidla nerozumí širšímu kontextu.

Počítačové překlady ještě nedávno vyžadovaly přesné zadání. Stačila jedna tečka navíc, triviální překlep – a program reagoval tím, že zadání odmítl, případně vyhotovil zcela nesprávný překlad.

Současné překladače využívající AI zpravidla pochopí, jak mělo zadání vypadat, a překlepy nám zpravidla velkoryse prominou. Některé programy, např. ChatGPT, jsou schopny s vámi komunikovat a získat od vás pokyny formou rozhovoru. Ale pozor, i zde platí, že čím preciznější je zadání, tím lepší bude výsledek. Problematika zadávání úkolů (tzv. promptů) se stala samostatným oborem.

Se schopností učit se a s rostoucí inteligencí však překladače možná trochu překvapivě přebírají i mnohé – ne zrovna dobré – vlastnosti svých lidských kolegů.

Stroj byl totiž poučen, že musí vždy odpovědět. Žádná odpověď je nejhorší odpověď. Samozřejmě toto pravidlo proniklo i do strojového překládání. Takže program vám text přeloží prakticky vždy, navíc celkem věrohodným způsobem, jenže když neví, odhadne význam podle svého. Když je zle, začne překládat jednotlivé věty a v nejhorším případě jednotlivá slova samostatně, opět stejně jako špatný překladatel. Obtížné slovo v tomto případě mnohdy dokonce vynechá. Někdy zmizí bez náhrady i celá věta.

Na rozdíl od profesionálního překladatele s vámi stroj nebude o problému z vlastní iniciativy diskutovat, nezeptá se autora originálu na skutečný význam.

I u strojů se při překládání rozsáhlejších textů projevuje efekt, který se podobá únavě a ztrátě koncentrace člověka. Po mnoha kvalitních stránkách tak přicházejí výpadky a překlad náhle věcně neodpovídá originálu. Setkáme se i se samovolnými změnami terminologie, obdobně jako když se na překladu střídají dva překladatelé.

Jednu častou chybu pak strojové překladače „zdědily“ po nástrojích počítačové podpory překladu CAT. CAT nástroje používají překladové paměti, ve kterých jsou uloženy dvojice větných segmentů, v originálu a překladu, často od různých překladatelů za řadu let. Jakmile se v právě překládaném textu objeví shodný nebo alespoň podobný segment, program automaticky nabídne k převzetí překlad z paměti a upozorní na případné odchylky originálu od právě překládaného textu. Když nástroj překládá výčet několika bodů, stává se, že přebírá jednotlivé body samostatně z různých textů, takže výčet je nekonzistentní. Pokud mají podměty vět v originálu a překladu různý rod, mívají v překladu nesprávný rod zájmena v navazujících větách. A tyto problémy nejsou cizí ani modernímu strojovému překladu.

Vynikajících výsledků lze dosáhnout, když se učí překladač zaměřený na konkrétní odbornou oblast. K učení je nicméně nutné mít k dispozici obrovské množství textů, v případě NMT dokonce dvojjazyčných.

Optimálního výsledku lze dosáhnout u textů stejného odborného zaměření překládaných ve velkých množstvích. Příkladem mohou být manuály globálně působících výrobců nebo dokumenty Evropské unie. Velké jazykové modely LLM a systémy NMT se tak dají trénovat pro daný, specifický účel.

Jeden příklad za všechny: V polovině června letošního roku oznámil mluvčí Evropské komise Eric Mamer spuštění pilotního projektu. Napříště bude Evropská komise pomocí vlastního nástroje eTranslation dávat novinářům v tiskovém koutku k dispozici strojové překlady tiskových zpráv – bez jakékoli lidské kontroly a bezprostředně po jejich zveřejnění. Pouze budou v horní části stránky označené prohlášením EK o vyloučení odpovědnosti. Prozatím však bude každá tisková zpráva současně překládána také člověkem. Jakmile bude lidský překlad hotov, nahradí ten strojový.

Uživatelům překládajícím relativně malé objemy různých textů jsou k dispozici všeobecně trénované systémy LLM, které však zpravidla nemají dostatečné znalosti v oboru uživatele. Nelze než důrazně doporučit, abyste pečlivě zkontrolovali přeložený text dříve, než jej dáte z ruky.

Nebezpečnou, i když dnes velmi moderní alternativou je korektura provedená pomocí ChatGPT. Korigovaný text zpravidla vypadá zřetelně lépe, ale věcné chyby pravděpodobně zůstanou neodhaleny.

Dobrou volbou je využít služby profesionálního korektora strojových překladů (posteditora). Nespornou výhodou je, že má praxi a důvěrně zná chyby, kterých se stroje rády dopouštějí.

Platí, že kvalita korektury zásadním způsobem ovlivňuje celkovou kvalitu strojového překladu.

Pokrok a schopnosti moderních překladačů jsou obdivuhodné. Stále častěji jejich výstup dostačuje pro požadované použití. Přesto se však strojový překlad vyrovná spíše práci středoškoláka nebo studenta, který je u vás na stáži. Profesionální překladatel je prozatím lepší volbou. Je tedy třeba se u každého textu rozhodnout, zda tentokrát vystačíte s překladem od brigádníka, nebo zda záleží na každém slově a vy se chcete pod dokument podepsat.

https://www.preklady-spevacek.info/

Jiří Spěváček, soudní překladatel a tlumočník, zakladatel společnosti SPĚVÁČEK překladatelská agentura s. r. o.
Ilustrační foto: archiv autora

Umělá inteligence a strojový překlad se dostaly do centra obecného zájmu

Mohlo by vás zajímat

Letošní již 31. ročník oblíbených „Parohů“ je zrušen

Sněmovna asi zpřesní zákon o národních sankcích za protiprávní jednání