Naukowcy stworzyli "myślący" model AI… za 50 dolarów. Ale jest haczyk
Czy AI musi kosztować fortunę? Cóż, niekoniecznie. Naukowcy z amerykańskich uniwersytetów udowodnili, że można zrobić to za grosze. Diabeł jednak jak zwykle tkwi w szczegółach.
W niedawno opublikowanym artykule naukowym badacze chwalą się ciekawym osiągnięciem. Mianowicie korzystając z chmury obliczeniowej i funduszy w kwocie poniżej 50 dolarów, wytrenowali oni model AI zdolny do "rozumowania". Jak się jednak okazuje, nie wszystko jest tutaj tak kolorowe, jak można byłoby przypuszczać.
Budżetowe AI
Ze wspomnianego dokumentu wynika, że zespół badaczy z uniwersytetów Stanforda i Waszyngtona wstępnie przygotował bazowy model AI, a następnie pracował nad nim, odpowiednio go cały czas trenując – tak żeby finalnie mógł osiągnąć możliwość "rozumowania". Innymi słowy, chodziło o to, żeby ich testowy model nazwany s1 osiągnął podobne możliwości jak o1 rodem z OpenAI oraz chiński R1 firmy DeepSeek przy maksymalnie ograniczonych funduszach. I wygląda na to, że jest to prostsze niż można byłoby przypuszczać. Jest jednak jeden tu pewien bardzo mały haczyk.
Otóż przedsięwzięcie się udało – tyle że, żeby tego dokonać, badacze… posłużyli się już gotowym modelem z tą zdolnością i po prostu "wydestylowali" z niego tę umiejętność. Osiągnięto to jednak w ciekawy sposób: ich AI trenowało na odpowiedziach dostarczanych z "bogatszego" wzorca. W ten sposób o1 nauczył się "rozumowania" w stopniu, który pozwolił mu radzić sobie z zadaniami matematycznymi i dotyczącymi kodowania porównywalnie do najnowocześniejszych modeli OpenAI i DeepSeek.
Na pierwszy rzut oka wygląda to, mówiąc obrazowo, jak nauka na notatkach od kolegi, by nie powiedzieć, że ordynarne zżynanie od konkurencji. Eksperyment ten pokazał jednak, że AI mogą szkolić się od siebie nawzajem z pominięciem gigantycznych kosztów – te najwyraźniej można ponieść tylko raz, a potem przenosić umiejętność "rozumowania" pomiędzy kolejnymi egzemplarzami sztucznej inteligencji za ledwie ułamek początkowych kosztów. Zresztą, naukowcy sami zauważają, że modele wnioskowania można opracować przy użyciu stosunkowo niewielkiego zbioru danych, stosując tzw. metodę nadzorowanego dostrajania – wystarczy tylko, że nakaże się AI naśladować określone zachowania w tym zbiorze.