Jak szybkie są chińskie superkomputery?
Tianhe i inni
Według ATIP (Asian Technology Information Program) najszybszym chińskim superkomputerem jest Tianhe-3 zbudowany przez Narodowe Centrum Superkomputerów w Guangzhou. Urządzenie pracuje z wykorzystaniem procesorów Phytium 2000+ (FTP) bazujących na architekturze ARMv8. Maszyna pracuje zwykle ze standardowym obciążeniem HPC oraz z pełną precyzją FP64. W przypadku obciążeń typu AI, które nie wymagają precyzji FP64, superkomputer wykorzystuje akceleratory DSP Matrix 2000+ (MTP). ATIP informuje, że Tianhe-3 osiąga moc obliczeniową około 1,3 EFLOPS.
Drugim z kolei najwydajniejszym chińskim superkomputerem jest Sunway Oceanlite, który pracuje w Narodowym Centrum Badawczym Inżynierii i Technologii Komputerów Równoległych (NRCPC). Maszyna bazuje na 390-rdzeniowych, hybrydowych procesorach Sunway, których budowa oparta jest na procesorach Sunway SW26010. Szybkość obliczeń Sunway Oceanlite ma wynosić około 1,05 EFLOPS.
Chińscy specjaliści z Narodowego Centrum Superkomputerowego w Shenzhen również zaprojektowali maszynę klasy eksaskalowej, jednak ukończenie tego projektu stoi pod znakiem zapytania ze względu na amerykańskie ograniczenia eksportu technologii do Państwa Środka. Obecnie więc Chińczycy twierdzą, że posiadają dwa w pełni funkcjonalne superkomputery klasy eksaskalowej.
Wydajność superkomputerów – zależy jak mierzyć
Pomiary szybkości obliczeń superkomputerów wykonuje się za pomocą benchmarku LINPACK, mierząc liczbę wykonanych operacji zmiennoprzecinkowych pojedynczej precyzji na sekundę (FP32 FLOPS) lub w FP64 FLOPS (operacje podwójnej precyzji). Ostatecznym wyznacznikiem wydajności superkomputerów jest ta druga wartość, bo obliczenia FLOPS z niższą precyzją będą zawsze wykonane szybciej.
Wydajność dwóch opisanych wyżej chińskich superkomputerów została zmierzona z wykorzystaniem LINPACK-a, czyli FP64 FLOPS. Jednak testujący nie przesłali szczegółowych danych z pomiarów witrynie Top500.org, która jest najważniejszym rankingiem najszybszych maszyn obliczeniowych na świecie. Niektórzy obserwatorzy twierdzą, że zrobiono tak z ostrożności, w obliczu amerykańskich sankcji nałożonych na Chiny.
Jednak konstruktorzy z NRCPC zgłosili maszynę Sunway Oceanlite do nagrody Gordona Bella. Jej zdobycie uzależnione jest od wykonania w określonym czasie symulacji 53-kubitowego obwodu Sycamore opartego na architekturze kwantowej Google'a. Według swoich twórców Sunway Oceanlite wykonał zadanie w czasie 304 sekund, podczas gdy kwantowy Sycamore zrobił to w 200 sekund. Osiągnięcie Sunway Oceanlite wydaje się wręcz szokujące, ponieważ szacuje się, że superkomputer Summit o mocy obliczeniowej 200 PFLOPS wykonywałby te obliczenia przez 10 tys. lat.
Okazuje się, że haczyk tkwi w poziomie precyzji obliczeń. Inżynierowie z NRCPC zgłosili do nagrody obliczenia swojego superkomputera wykonane z niższą precyzją, co musiało dać tak dobre rezultaty. Obliczenia na wyższym poziomie precyzji (FP64 FLOPS) są wykonywane dużo wolniej.
Specjaliści z NRPC zmniejszyli precyzję wykonywanych obliczeń, aby zdobyć nagrodę Gordona Bella, co jest podejściem nieuczciwym. Czy w przypadku rezultatów osiąganych przez inne superkomputery Chińczycy postępują podobnie?
fot. 12019 – Pixabay