Nowy model AI Google DeepMind znacząco rozszerza możliwości robotów przemysłowych. Dzięki Gemini Robotics-ER 1.6 czworonożny Spot firmy Boston Dynamics potrafi z dużą precyzją odczytywać analogowe termometry i manometry podczas inspekcji zakładów.
Zaprezentowany 14 kwietnia model Gemini Robotics-ER 1.6 to – według Google DeepMind – system wysokopoziomowego wnioskowania dla robotów, który pozwala im planować i wykonywać złożone zadania w świecie fizycznym. Jednym z kluczowych zastosowań jest zdolność do interpretacji analogowych przyrządów pomiarowych, takich jak termometry czy wskaźniki ciśnienia.
To istotny krok naprzód, bo odczyt takich urządzeń wymaga nie tylko rozpoznawania obrazu, ale także złożonego wnioskowania wizualnego – uwzględniającego wskazówki, skale, poziomy cieczy czy oznaczenia.
„Agentic vision” robi różnicę
Za poprawę możliwości odpowiada mechanizm określany jako „agentic vision”. Łączy on analizę obrazu z możliwością wykonywania kodu, tworząc swego rodzaju „wizualny notatnik”, który pomaga robotowi interpretować to, co widzi.
Efekty są wyraźne. Skuteczność odczytu wskaźników wzrosła z 23% w modelu Gemini Robotics-ER 1.5 do 98% w wersji 1.6. Nawet bez tej funkcji nowy model osiąga około 86% trafności. System poprawia także tzw. „multi-view reasoning”, czyli zdolność rozumienia otoczenia na podstawie wielu strumieni wideo jednocześnie.
Nowy model radzi sobie lepiej również z klasycznym problemem AI – halucynacjami. W testach polegających na identyfikacji przedmiotów w zagraconym obrazie starsza wersja modelu błędnie rozpoznawała obiekty lub pomijała istniejące. Gemini Robotics-ER 1.6 znacząco ogranicza tego typu błędy.
Według Google DeepMind jest to także „najbezpieczniejszy model robotyczny” firmy. System lepiej respektuje fizyczne ograniczenia środowiska i trafniej ocenia ryzyko dla ludzi – na przykład w sytuacjach potencjalnie niebezpiecznych.
Zastosowanie praktyczne
Spot robot firmy Boston Dynamics jest już testowany jako autonomiczny inspektor w zakładach przemysłowych, w tym w fabrykach należących do Hyundai Motor Group.
Robot porusza się po obiektach i analizuje stan infrastruktury: od instalacji przemysłowych po urządzenia pomiarowe. Nowe możliwości AI pozwalają mu wykonywać te zadania dokładniej i bardziej samodzielnie.
Krok w stronę bardziej uniwersalnych robotów
Dotychczas roboty przemysłowe najlepiej sprawdzały się w powtarzalnych, ściśle kontrolowanych zadaniach. Nowe modele AI mają zmienić ten paradygmat, umożliwiając maszynom działanie w bardziej złożonych i mniej przewidywalnych środowiskach.
To jednak wciąż etap testów. Realna wartość Gemini Robotics-ER 1.6 zostanie zweryfikowana dopiero w praktycznych wdrożeniach. Jedno jest pewne: rozwój „ucieleśnionej inteligencji” (embodied AI) wyraźnie przyspiesza i coraz śmielej wychodzi poza laboratoria.
0 komentarzy