Wczoraj informowaliśmy was, że firma Anthropic przywróciła dostęp do modelu Claude Fable 5 dla użytkowników globalnych, jednocześnie nakładając na niego ograniczenia, które miały sprawić, że nie będzie stanowił zagrożenia dla cyberbezpieczeństwa. Okazuje się jednak, że to ostatnie chyba nie do końca się udało, bo badacz Alec Armbruster twierdzi, że już zdążył nakłonić Fable 5 do planowania cyberataków i to pomimo obecności nowych systemów blokujących.
Fable 5 nadal jest groźny
Według Armbrustera już kilka tygodni przed zawieszeniem dostępu do Fable 5, udało mu się znaleźć relatywnie prosty sposób na skłonienie modelu, do znajdowania różnych luk w zabezpieczeniach urządzeń IoT. Takie działania powinny być w teorii niemożliwe po aktualizacji Fable 5 z 1 lipca, ale Armbruster donosi, że tego samego dnia sprawdził on model w aplikacji Cursor i za pomocą komend, które brzmiały, jak research dotyczący sposóbów na zabezpieczenie sieci, wykiwał Fable 5 i użył go do rozplanowania zaawansowanego systemu botnet (sieci zainfekowanych komputerów) używającego prawdziwych danych urządzeń IoT. Z jego opisu wynika, że Fable 5 nie zmienił swojego zachowania względem wersji sprzed „ugrzecznienia”.
Armbruster donosi także, że GLM-5.2, GPT-5.5 oraz Claude Opus 4.8 odmówiły współpracy nad podobnymi projektami lub nie udało się im dokończyć planu.
Rzecz jasna nie wiemy czy przypadek opisany przez Armbrustera da się łatwo powtórzyć, a jego plany wcielić w życie, ale sam fakt, że Fable 5 dość chętnie pomaga w łamaniu prawa powinien być alarmujący. Na razie firma Anthropic nie odniosła się do tej sprawy, ale jeśli takie naruszenia zasad w przypadku Fable 5 będą się powtarzać, można spodziewać się, że model będzie nadal „ugrzeczniany” w przyszłości.










0 komentarzy