AktualnościLekarze mogą się bać: AI Microsoftu diagnozuje czterokrotnie lepiej

Lekarze mogą się bać: AI Microsoftu diagnozuje czterokrotnie lepiej

Microsoft stworzył system AI o nazwie MAI‑DxO, który rozpoznaje złożone choroby cztery razy skuteczniej niż doświadczeni lekarze – z dokładnością sięgającą do ponad 85 %. W tych samych warunkach ludzie osiągnęli zaledwie ok. 20 % trafnych diagnoz.

Medyczna AI, zdjęcie ilustracyjne
Medyczna AI, zdjęcie ilustracyjne
Źródło zdjęć: © Adobe Stock | Monika

Nowe narzędzie Microsoftu opiera się na tzw. "orkiestracji", czyli w tym wypadku połączeniu pięciu różnych modeli językowych (m.in. pochodzących z OpenAI, Google’a i Mety), działających niczym zespół specjalistów. Modele językowe wspólnie generują hipotezy, wybierają testy, analizują wyniki i w ten sposób dochodzą do diagnozy. Praca tego rodzaju została oceniona w teście, na który złożyły się 304 przypadki medyczne z New England Journal of Medicine. Sztuczna inteligencja kolejno analizowała i rozwiązywała je krok po kroku dzięki metodzie "chain of debate". Wyniki zaś przerosły najśmielsze oczekiwania.

Skuteczność, oszczędność i potencjalne zastosowania

W trakcie testu MAI‑DxO osiągnął skuteczność 85,5 %, czyli ponad czterokrotnie lepiej niż w przypadku lekarzy, których wynik wyniósł ok. 20 %. Dodatkowo system zoptymalizował koszty badań – aż o 20 % mniej diagnostycznych procedur, co może przełożyć się na setki tysięcy dolarów oszczędności. W wypowiedzi dla Financial Times jeden z naukowców nie kryje ekscytacji takimi rezultatami:

System osiągnął lepsze wyniki niż wszystko, co widzieliśmy do tej pory. Istnieje tu realna szansa, by stać się czymś na kształt nowego punktu wejścia do opieki zdrowotnej.

Dominic KingMicrosoft AI

Microsoft podkreśla jednak, że chociaż wyniki są obiecujące, MAI‑DxO nadal wymaga walidacji klinicznej. Próby odbywały się w kontrolowanych warunkach – bez dostępu lekarzy do podręczników czy konsultacji z kolegami – co może wpływać na rzeczywistą wydajność systemu. Microsoft planuje sprawdzić również i to: tego rodzaju badania mają być kolejnym krokiem. Co jednak ciekawe – wcale nie ostatnim.

Firma przygotowuje się bowiem również też do wdrożenia przedstawianej tu technologii w ramach aplikacji Copilot i wyszukiwarki Bing, z których pochodzi aż 50 milionów zapytań zdrowotnych dziennie. To zaś może zwiększyć dostępność narzędzi wspomagających diagnozę także wśród pacjentów.

Potencjalne wątpliwości

Choć pierwsze wyniki prac MAI‑DxO imponują, nietrudno zauważyć, że badanie opierało się na przypadkach skrajnie trudnych, rzadko spotykanych w codziennej praktyce. Nie oceniono też, jak system radzi sobie z typowymi objawami czy kontekstem pacjenta. Tym samym komentarze ze środowiska medycznego skupiają się na fakcie, że choć pierwsze dowody na efektywność generatywnego AI są obiecujące, to wymagane są kolejne testy oraz ocena aspektów etycznych i bezpieczeństwa, których tutaj w ogóle nie brano pod uwagę.

Nie zmienia to jednak faktu, że MAI‑DxO jest obiecującym krokiem w stronę "medycznej superinteligencji" i może zwiększyć dokładność diagnozy i obniżyć koszty. Jednak zanim trafi do szpitali, czekają go testy kliniczne, walidacja w warunkach rzeczywistych oraz – co chyba najważniejsze – konieczność uzyskania odpowiednich zgód ze strony prawodawcy. A do tego droga jeszcze raczej daleka.

Grzegorz Karaś, dziennikarz pcformat.pl

Wybrane dla Ciebie