AktualnościNowa AI rodem z Chin. Czy Ernie powtórzy sukces DeepSeek?

Nowa AI rodem z Chin. Czy Ernie powtórzy sukces DeepSeek?

Otwartoźródłowa rodzina modeli sztucznej inteligencji Ernie 4.5 zadebiutowała wraz z końcem czerwca, a eksperci zaczęli głowić się nad tym, czy dziełu chińskiej firmy Baidu uda się powtórzyć sukces DeepSeek.

Chiny
Chiny
Źródło zdjęć: © Adobe Stock | Jason Wells

Ernie 4.5 to nie tyle jeden model AI, ile ich cała rodzina. Składa się ona z 10 różnych wariantów multimodalnych modelów wielkoskalowych, a każdy z nich został wytrenowany przy pomocy frameworka głębokiego uczenia PaddlePaddle. Baidu, twórcy projektu, utrzymują, że takie rozwiązanie umożliwia zarówno wysokowydajne wnioskowanie, jak i usprawnione wdrażanie ich technologii. Czy Erniemu uda się powtórzyć ogromny sukces, jaki osiągnął DeepSeek i czy amerykańscy giganci technologiczni mają powody do obaw w związku z premierą kolejnej chińskiej sztucznej inteligencji?

Nowa AI rodem z Chin. Czy Ernie powtórzy sukces DeepSeek?

Już na wstępie warto zaznaczyć, że Baidu nie zawsze było orędownikiem tworzenia otwartoźródłowego oprogramowania i raczej stroniło od udostępniania wytworów swoich inżynierów w ramach otwartej licencji. DeepSeek udowodnił jednak, że takie podejście może pomóc przebić się do szerszej świadomości, szczególnie na Zachodzie – a na tym właśnie zależy Chińczykom.

Wspomniana rodzina Ernie 4.5 składa się z modeli Mixture-of-Experts (MoE) z 47B i 3B aktywnymi parametrami. Największy model spośród tych udostępnionych posiada aż 424B parametrów całkowitych, aczkolwiek Baidu przygotowało także "lżejszą" propozycję w postaci wersji o gęstości na poziomie 0,3B. Producent zapewnia, że za sprawą zastosowania architektury Moe, Ernie potrafi obsługiwać "współdzielenie parametrów między modalnościami, jednocześnie umożliwiając dedykowane parametry dla każdej indywidualnej modalności". Co więcej, rozwiązanie takie podobno gwarantuje poprawę rozumienia multimodalnego przy jednoczesnym usprawieniu wydajności w zadaniach związanych z tekstem.

Modele Ernie 4.5
Modele Ernie 4.5© Baidu

Baidu chwali się tym, że Ernie 4.5 wyróżnia się na tle konkurencji za sprawą trzech aspektów. Są to:

  1. Wielomodalne niejednorodne szkolenie wstępne MoE – wszystkie modele zostały przeszkolone w zakresie modalności tekstowej oraz wizualnej, co ma pomóc w "uchwyceniu niuansów informacji multimodalnych" oraz w poprawieniu wydajności w zadaniach obejmujących rozumowanie multimodalne, jak i te związane z samym tekstem lub obrazem.
  2. Wydajna infrastruktura – Baidu twierdzi, że wydajne szkolenie modeli wchodzących w skład Ernie 4.5 było możliwe za sprawą nowatorskiej, heterogenicznej, hybrydowej równoległości oraz hierarchicznej strategii równoważenia obciążenia. Powstały na bazie PaddlePaddle Ernie ma zapewniać wysoką wydajność wnioskowania na szerokiej gamie platform sprzętowych.
  3. Trening końcowy specyficzny dla danej modalności – warianty wstępnie wyszkolonego modelu zostały dostrojone do określonych modalności, aby spełnić wymagania stawiane przez rzeczywiste aplikacje.

Co ciekawe, w przypadku testów porównawczych, Ernie 4.5 został postawiony naprzeciw DeepSeek, a nie produktów amerykańskich firm. Jeśli wierzyć przechwałkom Baidu, ich najnowsze dzieło pobiło DeepSeek-V3-671B-A37B-Base w 22 z 28 przeprowadzonych benchmarków. Zdeklasowana została również inna chińska AI – Qwen3-30B-A3B-Base.

Wydajność Ernie 4.5 przed szkoleniem
Wydajność Ernie 4.5 przed szkoleniem© Baidu

Jeśli chcemy dowiedzieć się więcej na temat Ernie 4.5 lub osobiście przetestować rzeczoną sztuczną inteligencję, więcej informacji na ten temat znajdziemy na stronie jej producenta. Cała rodzina modeli została udostępniona licencji Apache 2.0, co oznacza, że można je wykorzystywać komercyjnie, acz z zastrzeżeniem warunków.

Jakub Dmuchowski, dziennikarz pcformat.pl

Wybrane dla Ciebie