Najpierw TikTok, teraz robot. Złoży za ciebie ubrania i upora się z brudnymi talerzami
ByteDance, chiński gigant technologiczny odpowiedzialny za stworzenie TikToka, pochwalił się swoim najnowszym dokonaniem – bazującym na sztucznej inteligencji robotycznym "mózgiem" GR-3.
GR-3 to zakrojony na dużą skalę model wizji-języka-działania (ang. vision-language-action, VLA). Jak przekazali jego twórcy, chińskie przedsiębiorstwo ByteDance, "wykazuje on zdolność do uogólniania nowych obiektów, środowisk i instrukcji dotyczących pojęć abstrakcyjnych". GR-3 wyróżnia się nie tylko łatwością w dostosowywaniu się przy wykorzystaniu minimalnej ilości danych dotyczących trajektorii ruchu człowieka, ale także zdolnością do sprawnego wykonywania zadań zakładających potrzebę popisania się zręcznością oraz długoterminowym planowaniem. Co istotne – dzieło ByteDance świetnie operuje mechanicznymi ramionami, z ich pomocą składając pranie lub uprzątając brudne naczynia ze stołu.
Twórcy TikToka stworzyli robota
Możliwości GR-3 zostały zaprezentowane z wykorzystaniem robota ByteMini. Po zaimplementowaniu mu "mózgu", urządzenie było w stanie zrozumieć i zrealizować polecenia wydawane w naturalnym języku. W filmie opublikowanym w sieci przez ByteDance możemy zobaczyć, jak maszyna zakłada koszulę na wieszak i odkłada ją na odpowiednie miejsce. Prócz tego robot poradził sobie z posprzątaniem resztek jedzenia i zastawy stołowej, był w stanie również rozpoznać konkretne liczby i przedmioty.
Dalsza część artykułu pod materiałem wideo
字节跳动Seed团队最新推出Vision-Language-Action(VLA)模型Seed GR-3
Jak tego dokonano?
Chińska firma utrzymuje, że udało jej się opracować taką technologię za sprawą zastosowania wieloaspektowej receptury szkoleniowej. Jak napisano w artykule, "obejmuje wspólne szkolenie z wykorzystaniem danych wizualno-językowych w skali internetowej, wydajne dostrajanie z wykorzystaniem danych dotyczących trajektorii ruchu człowieka, opracowanych przez członków laboratorium w oparciu o urządzenie VR, oraz skuteczne uczenie się przez naśladowanie z wykorzystaniem danych dotyczących trajektorii ruchu robota".
ByteDance jest świadome faktu, że jego dziełu jeszcze daleko do ideału, niemniej żywi głęboką nadzieję, że spełni ono rolę swoistego kamienia milowego na drodze ku opracowaniu pełnoprawnego mózgu dla robotów ogólnego przeznaczenia.
Dzięki szeroko zakrojonym eksperymentom w rzeczywistych warunkach GR-3 wykazuje uniwersalną i niezawodną wydajność w trzech wymagających zadaniach. Mamy nadzieję, że GR-3 będzie stanowił znaczący krok w kierunku stworzenia "mózgu" robota ogólnego przeznaczenia.
Warto przy tym pamiętać, że chińska korporacja nie jest jedyną, która pracuje nad podobną technologią. Analogiczne plany ma m.in. amerykańska Tesla, która niedawno ogłosiła, że jej humanoidalne roboty, Optimusy, zostaną wyposażone w moduł sztucznej inteligencji bazujący na dobrze znanym użytkownikom X-a Groku.
Samo ByteDance zaś ciągle boryka się z problemami w Stanach Zjednoczonych. Mimo szumnych zapowiedzi Donalda Trumpa co do sprawnego rozwiązania kwestii przyszłości firmy i jej sztandarowego produktu, czyli TikToka, w USA, na ten moment wciąż nic nie ustalono. Co prawda prezydent Stanów podobno znalazł już rzeszę potencjalnych nabywców aplikacji, niemniej ze względu na napięcia z Pekinem ten skutecznie blokuje dojście sprzedaży do skutku.
Jakub Dmuchowski, dziennikarz pcformat.pl