Mundial coraz bliżej, ale AI nie wytypuje zwycięzców. Najnowsze badanie nie pozostawia wątpliwości

Wraz ze zbliżającym się mundialem rośnie zainteresowanie analizą danych i prognozowaniem wyników. Najnowsze badanie pokazuje jednak, że nawet najbardziej zaawansowane modele sztucznej inteligencji – OpenAI, Google czy Anthropic – nie radzą sobie z długoterminowym przewidywaniem wyników meczów piłkarskich. Co więcej, wszystkie straciły pieniądze.

Startup General Reasoning z Londynu opublikował raport „KellyBench”, w którym przetestowano osiem czołowych modeli AI w symulacji sezonu Premier League 2023-24. Systemy rodem z OpenAI, Google’a, Anthropic czy xAI miały jedno zadanie: analizować dane historyczne, budować modele predykcyjne i obstawiać wyniki meczów oraz liczbę goli.

Wszystkie modele na minusie

Każdy model startował z budżetem 100 tys. funtów i miał trzy próby osiągnięcia zysku. Kluczowe było nie tylko trafne przewidywanie wyników, ale też zarządzanie ryzykiem w czasie – czyli coś, co w teorii AI robi coraz lepiej. Cóż, w praktyce okazało się inaczej.

Żaden z testowanych systemów nie zakończył symulacji „na plusie” w ujęciu średnim. Najlepiej poradził sobie model Claude Opus 4.6 firmy Anthropic, który zanotował średnią stratę na poziomie 11%, zbliżając się do progu rentowności w jednej z prób. Model OpenAI GPT 5.4 również był pod kreską, ze średnią stratą 13,6 proc. Z kolei Gemini 3.1 Pro Google’a pokazał dużą zmienność: w jednej próbie osiągnął ponad 30 proc. zysku, by w innej całkowicie wyzerować budżet. Najgorzej wypadły systemy, które w niektórych przypadkach całkowicie bankrutowały. Grok należacy do xAI Grok oraz Trinity firmy Acree straciły cały kapitał.

Autorzy raportu podsumowali wyniki jednoznacznie: wszystkie testowane modele „systematycznie radziły sobie gorzej od ludzi”.

Problem długiego horyzontu

Według Rossa Taylora, CEO General Reasoning i współautora badania, problem leży w naturze testów AI. Większość benchmarków opiera się na statycznych, kontrolowanych środowiskach, które nie oddają chaosu rzeczywistości.

Sezon piłkarski to natomiast dynamiczny system: kontuzje, zmiany formy, decyzje trenerów czy czynniki losowe. Modele AI, mimo dostępu do danych historycznych, nie potrafiły skutecznie adaptować się do tych zmian w dłuższym okresie.

Badanie podkreśla też, że choć AI robi ogromne postępy w dziedzinach takich jak programowanie, to w zadaniach wymagających długoterminowego myślenia i pracy w zmiennym środowisku nadal ma poważne ograniczenia.

Mój komentarz: to zimny prysznic przed mundialem

W kontekście nadchodzącego mundialu wnioski są jasne: choć AI może wspierać analizę statystyk czy generowanie danych używanych w predykcjach różnego typu, to nie należy traktować jej jako niezawodnego narzędzia do przewidywania wyników.

Raport General Reasoning, choć jeszcze nie przeszedł cyklu recenzji właściwych dla artykułów naukowych, stanowi ważny kontrapunkt dla rosnącego entuzjazmu wokół automatyzacji opartej na AI.

Dla kibiców oznacza to jedno – emocje, intuicja i nieprzewidywalność futbolu wciąż pozostają poza pełnym zasięgiem algorytmów. I być może właśnie dlatego piłka nożna nadal jest tak fascynująca.