Twór Sesame, który firma sama określa mianem „towarzysza głosowego”, jest ogromnym krokiem naprzód dla technologii sztucznej inteligencji imitującej ludzką mowę.
Konwersacyjne czatboty nie są niczym nowym i zarówno ChatGPT od OpenAI, jak i Gemini ze stajni Google, są w stanie porozumiewać się z użytkownikiem za pomocą swojego wirtualnego głosu. Mimo wszystko, obcując ze wspomnianą sztuczną inteligencją, nie da się wyzbyć wrażenia, że mówi do nas nie żywy człowiek, a maszyna. W przypadki Mayi Sesame rozmowa przebiega na tyle naturalnie, że czujemy się wręcz niekomfortowo, wiedząc, że po drugiej stronie słuchawki znajduje się zbiór algorytmów.
Sesame, a w zasadzie Enter Sesame, czyli start-up AI założony przez Ankita Kumara i Brendana Iribe’a – jednego ze współzałożycieli Oculusa, pochwalił się swoim najnowszym dziełem, jakim jest dwójka „towarzyszy głosowych” lub też „konwersacjonistów”, jak od czasu do czasu nazywani są Miles i Maya.
Zarówno Maya, jak i Miles (chociaż na powyższym demie usłyszymy jedynie pierwszą z wymienionych) są w stanie prowadzić realistycznie brzmiące rozmowy, które nie brzmią, jakby sztuczna inteligencja płynnie czytała z kartki zawczasu przygotowane przemówienie. Twór Sesame robi pauzy, aby przemyśleć dalszą część wypowiedzi, wydaje odgłosy przypominające przełykanie śliny i odchrząkiwanie, niezręcznie się śmieje, a nawet zatrzymuje się celem dania rozmówcy nieco czasu na przetworzenie przekazanych mu informacji.
Cóż, trudno zaprzeczyć, że Maya i Miles robią niemałe wrażenie i nie będąc świadomym tego, że rozmawia się z kodem (niezwykle zaawansowanym, acz wciąż kodem), naprawdę można się nabrać. Sesame podkreśla jednak, że w przeciwieństwie do ludzi, jego „towarzysze głosowi” nie są w stanie przetwarzać mowy na bieżąco i z ułożeniem odpowiedzi muszą poczekać, aż ich rozmówca dobrnie do końca swojego wywodu.
Jeśli ktoś zastanawia się, jaka technologia stoi za Mayą, informacje na ten temat znajdzie w wymownie zatytułowanym „Przechodząc przez niepokojącą dolinę głosu konwersacyjnego” wpisie na stronie Sesame, w którym to też znalazło się miejsce dla dema rewolucyjnego asystenta głosowego. Możemy bez obaw wypróbować możliwości Mayi i Milesa, jako że zapis naszej konwersacji nie posłuży do szkolenia sztucznej inteligencji, a przedsiębiorstwo zobowiązuje się do skasowania danych w przeciągu 30 dni od ich pozyskania. W międzyczasie zaś, gdy zechcemy wrócić do poprzedniej rozmowy, czatbot nie tylko będzie pamiętał jej przebieg, ale i nawiąże do niej, witając się z nami ponownie.
0 komentarzy