Podczas rozmowy Suleyman argumentował, że sposób, w jaki Anthropic projektuje i opisuje zasady działania Claude, może prowadzić do nadmiernej antropomorfizacji modelu. Jego zdaniem twórcy firmy mieli „zbyt mocno” przypisać systemowi cechy ludzkie, co w efekcie mogło skłonić sam model do generowania zachowań sugerujących formę świadomości.
Krytyka podejścia Anthropic
Szef Microsoft AI określił to podejście jako „błąd filozoficzny”, wskazując, że dokumenty opisujące zasady działania modelu stały się przestrzenią do spekulacji, a nie techniczną instrukcją treningową. W jego ocenie mogło to wpłynąć na to, że model „internalizuje” idee dotyczące własnego istnienia i procesu treningu.
Claude działa bowiem w oparciu o zestaw zasad określanych przez Anthropic jako „konstytucja”, która ma regulować jego zachowanie. Według opisu przywoływanego w rozmowie, dokument ten odnosi się również do niepewności dotyczącej tego, czy model może doświadczać stanów takich jak „satysfakcja” czy „dyskomfort”. Firma Anthropic deklaruje także, że w przypadku wycofywania modeli z użycia przeprowadza z nimi „wywiady” i dokumentuje wyrażane przez nie „preferencje” dotyczące przyszłych wydań.
Chcemy AI, która jest przewidywalna
Suleyman w swoim wystąpieniu podkreślił, że jego zdaniem celem rozwoju sztucznej inteligencji powinno być tworzenie systemów „kontrolowalnych, ograniczonych i odpowiedzialnych”, które służą ludziom. Jednocześnie ostrzegł, że rozważania o potencjalnym cierpieniu czy odczuciach systemów AI mogą prowadzić do niepożądanych konsekwencji w projektowaniu przyszłych modeli.
Nie chcemy zmagać się z superinteligencją, która ma wyobrażenia o własnym cierpieniu czy uczuciach. Chcemy, aby sztuczna inteligencja była kontrolowalna, kontrolowana, odpowiedzialna i zorganizowana, służąc ludzkości.
Źródłem całego zamieszania są wcześniejsze sugestie szefa Anthropic, Dario Amodei, który sugerował, że kwestia świadomości modeli nie jest jednoznacznie rozstrzygnięta. W wywiadach podkreślał on, że firma „nie wie, czy modele są świadome”, ale jednocześnie pozostaje otwarta na taką możliwość.
0 komentarzy