Sztuczna inteligencja tłumaczy zapomniane starożytne języki

6 lipca 2019, 09:00

Naukowcy z MIT oraz laboratorium Google AI opracowali system tłumaczenia maszynowego, który pozwala odszyfrowywać zapomniane języki.

Sztuczna inteligencja tłumaczy zapomniane starożytne języki

Ta historia sięga 1886 roku, kiedy to brytyjski archeolog Arthur Evans natknął się na starożytny kamień z ciekawym zestawem inskrypcji w nieznanym języku. Kamień pochodził z Krety, więc naukowiec natychmiast udał się na śródziemnomorską wyspę, gdzie odkrył wiele kamieni i tabliczek z podobnymi skryptami, pochodzących z ok. 1400 p.n.e. Evans był jednym z niezliczonych naukowców, którzy przez wiele lat próbowali rozszyfrować starożytne języki – jak dotąd bezskutecznie.

Aż do czasu, kiedy do odkodowywania zapomnianych języków nie zabrała się sztuczna inteligencja. Algorytmy zrewolucjonizowały badania nad lingwistyką w ciągu kilku lat, a tłumaczenie maszynowe z jednego języka na inny stało się rutyną. Kluczowym aspektem umożliwiającym tego rodzaju tłumaczenia jest to, że słowa są ze sobą powiązane w podobny sposób, bez względu na język. Umożliwia to mapowanie całego języka na inny język – tłumaczenie zdań staje się procesem znajdowania podobnych trajektorii w przestrzeni. Maszyna nie musi „wiedzieć", co oznaczają zdania, bo proces ten zależy przede wszystkim od dużych zbiorów danych, które można ze sobą w błyskawicznym tempie porównać.

Jak donosi MIT Technology Review, Jiaming Luo i Regina Barzilay z MIT oraz Yuan Cao z laboratorium Google AI w Mountain View w Kalifornii poszli o krok dalej. Oparli się na założeniu, że języki ewoluują w czasie tylko w określony sposób – symbole w językach pokrewnych są tworzone według takich samych wzorców, a powiązane ze sobą słowa mają taką samą kolejność znaków. Stworzenie tych reguł znacznie ograniczyło liczbę operacji wykonywanych przez opracowany przez nich algorytm.

Luo i jego zespół wypróbowali nową metodę na dwóch martwych językach – piśmie linearnym B, który koduje wczesną wersję starożytnej greki oraz ugaryckim. Język ten, odkryty w 1929 roku, odpowiada wczesnej formie języka hebrajskiego. Biorąc pod uwagę informacje i ograniczenia narzucone przez ewolucję językową, algorytm skonstruowany przez naukowców jest w stanie przetłumaczyć oba języki z niezwykłą dokładnością.

Wyzwaniem pozostaje wciąż pismo linearne A – wciąż nie wiadomo, w jakim języku zapisano teksty w linearnym A. Wielką zaletą rozszyfrowywania starożytnych języków przez sztuczną inteligencję jest to, że komputery mogą szybko analizować jeden język po drugim. Jest więc całkiem możliwe, że Luo i spółka mogą poradzić sobie z linearnym A, próbując język za językiem aż do skutku (metodą siłową – ang. brute force).

Zdjęcie: tabliczka z pismem linearnym B z pałacu w Pylos, Wikipedia

Tagi:

Ocena:

Oceń:

Komentarze (0)

Redakcja nie ponosi odpowiedzialności za treść komentarzy. Komentarze wyświetlane są od najnowszych.