Trenowanie algorytmu
Do osiągnięcia dużej skuteczności dopasowywania tekstu przeznaczonego do przetłumaczenia niezbędne są korpusy tekstów tłumaczonych przez ludzi. Skąd je wziąć? W przypadku silnika tłumaczącego firmy Google, który jako pierwszy z popularnych algorytmów tłumaczenia maszynowego zaczął wykorzystywać metodę statystyczną, sięgnięto po przekładane na wiele języków dokumenty ONZ. Obecnie systemy statystyczne są także szkolone na podstawie dokumentów Komisji Europejskiej oraz Parlamentu Europejskiego, których część jest tłumaczona na wszystkie 24 oficjalne języki Unii Europejskiej, w tym na język polski. Dodatkowych danych poprawiających jakość tłumaczenia mogą dostarczyć sami użytkownicy, którzy np. są proszeni przez mechanizm Google’a o poprawienie tłumaczenia. Z kolei Bing Translator, który tłumaczy rozmowy w Skypie, korzysta również z wielojęzycznych stron WWW oraz transkrypcji autentycznych konwersacji przetłumaczonych przez zawodowych tłumaczy.
Konwersja w chmurze
Aby algorytmy tłumaczenia statystycznego mogły działać efektywnie, niezbędne jest wsparcie chmury, która dostarcza mocy obliczeniowej. W przypadku dłuższych tekstów zadanie jest rozdzielane i przetwarzane równolegle w wielu węzłach. Dzięki temu wyniki są dostarczane niemalże w czasie rzeczywistym.
Po tym, jak system tłumaczący pozna znaczenie danego zwrotu, pozostaje jeszcze problem poprawnego sformułowania odpowiedzi. Nie zawsze można przywołać tłumaczenie pochodzące z wzorcowego tekstu, wykorzystanego do trenowania silnika tłumaczącego. W takiej sytuacji wykorzystywane są algorytmy odpowiadające za adaptację reguł gramatycznych oraz ustawianie słów w poprawnym szyku w zdaniu.
Po ułożeniu tekstu w obcym języku system tłumaczący przesyła treść do syntezatora mowy, który, podobnie jak większość komponentów systemu, działa w chmurze. Tekst jest tam przekształcany na mowę w obcym języku i przesyłany do odbiorcy. Cały proces wymiany danych pomiędzy klientem Skype’a a chmurą obsługuje wtyczka, która jest zintegrowana z komunikatorem.
Jakość tłumaczenia
Błędy w przekładzie, których ilość Microsoft szacuje na 15 proc., można częściowo wyeliminować mówiąc wyraźnie, krótkimi zdaniami. Większość błędów nie utrudnia zresztą zrozumienia zdań, choć obniżają precyzję przekazu, a jakość tłumaczenia konwersacji, przy założeniu poprawnego rozpoznania głosu, jest lepsza niż np. maszynowo tłumaczonych stron WWW. Wynika to stąd, że algorytmy statystyczne lepiej radzą sobie w dopasowaniu krótkich fragmentów tekstu, a z takich składa się rozmowa przez Skype. Tłumaczenie maszynowe ma przed sobą intrygującą przyszłość – technologią interesuje się też np. armia USA, chcąca m.in. skuteczniej porozumiewać się z tubylcami.
Gdzie testować tłumaczenie maszynowe?
Testowanie Skype Translatora jest utrudnione – obsługuje tylko języki angielski i hiszpański, a do utworzenia konta potrzebne jest zaproszenie. Do testów jakości tłumaczenia można jednak wykorzystać smartfona – ten sam co Skype Translator mechanizm rozpoznawania mowy, tłumaczenia i syntetyzowania dźwięku wykorzystuje usługa Translator w Windowsie Phone 8. Użytkownicy Androida mogą natomiast sprawdzić konkurencyjnego, ale działającego na tej samej zasadzie Tłumacza Google. Identyczny algorytm działa na stronie WWW, więc można tłumaczyć komunikaty głosowe i sprawdzać poprawność tłumaczenia w różnych językach za pomocą przeglądarki.
www.bing.com/translator/
https://translate.google.pl
Przebieg tłumaczenia w Skype Translatorze
1. Za rozpoznawanie głosu odpowiadają wielowarstwowe sieci neuronowe wzorowane na budowie mózgu. Każda nagrana wypowiedź jest wysyłana do chmury, która zapewnia moc obliczeniową.
2. Z wypowiedzi usuwane są wszystkie zanieczyszczenia typu: „yyy”, „hmm”, co poprawia skuteczność tłumaczenia.
3. Po przekształceniu głosu na tekst wypowiedź jest tłumaczona przez algorytmy wykorzystujące metodę statystyczną, uczone języków poprzez dostarczanie próbek tekstów przetłumaczonych przez ludzi. Odpowiednio duże próbki tłumaczeń są pobierane m.in. z baz organizacji międzynarodowych, np. ONZ.
4. Po przetłumaczeniu tekstu wypowiedź w obcym języku otrzymuje formę głosową za sprawą syntezatora mowy. Skype Translator dopowiada ją do wypowiedzi rozmówcy, do daje efekt podobny do pracy tłumacza-człowieka.