APU w służbie AMD
W obu konsolach nowej generacji znajdują się układy APU wyprodukowane przez AMD. Teraz firma ta stworzyła ich odpowiednik przeznaczony do pracy w komputerach osobistych. W ten sposób chce pokazać, że pecetowi gracze nie zawsze potrzebują najwydajniejszego procesora i karty graficznej.
Accelerated Processing Unit (APU) to procesor ze zintegrowaną grafiką (CPU+GPU). Pierwsze takie układy pojawiły się trzy lata temu dzięki AMD. Rozwiązanie się przyjęło i obecnie sprzedaż APU stanowi jedno z głównych źródeł zarobków nie tylko AMD, ale i Intela, który też wprowadza coraz lepszą grafikę do procesorów.
Najnowsza rodzina APU stworzonego przez AMD nosi nazwę Kaveri. Od poprzedników różni się zupełnie nową architekturą rdzeni procesora i układu graficznego, a także ciekawymi rozwiązaniami zastosowanymi po raz pierwszy w konsoli Playstation 4.
Ukryte nowości
Jedną z najważniejszych zmian jest zastosowanie nowych rdzeni procesora o nazwie kodowej Steamroller. Względem zeszłorocznych rdzeni Piledriver są one szybsze i bardziej energooszczędne. Kwestię większej wydajności rozwiązano tu m.in. przez dodanie drugiego dekodera rozkazów. Oprócz tego zwiększono ilość pamięci podręcznej pierwszego poziomu z 64 KB do 96 KB, dodano do niej nowy port dostępu. Obecnie pamięć jest trójdrożna, dzięki czemu jej komunikacja z trzema jednostkami planującymi jest bardziej efektywna. Tak jak poprzednie modele APU, Kaveri ma tylko dwa poziomy pamięci podręcznej, a nie trzy, jak procesory Intela. Zwiększono też szybkość zapisywania wyników obliczeniowych instrukcji w pamięci podręcznej pierwszego poziomu, poprawiono wydajność układu przewidywania skoków oraz wydajność bloku pobierania danych.
Rdzenie Steamroller nie obsługują żadnych nowych rodzajów instrukcji, co oznacza, że nie znajdziesz tu chociażby komend AVX2 znanych z układów Intel Haswell.
Wprowadzone zmiany w architekturze nie oznaczają jednak, że procesory z rdzeniami Steamroller będą znacznie szybsze od swoich poprzedników. Co prawda wydajność pojedynczego rdzenia ma wzrosnąć o 10–20 proc., jednak nowe układy będą się cechować niższą częstotliwością pracy. O ile zeszłoroczny model A10–6800K mógł osiągnąć maksymalną częstotliwość 4,4 GHz, o tyle w przypadku tegorocznego A10–7850K jest to 4 GHz. Usprawnienia w budowie rdzeni powinny jedynie minimalnie przekroczyć straty spowodowane spadkiem częstotliwości pracy.
Niższa moc
Jedną z najsłabszych stron układów AMD względem modeli konkurencyjnych jest wysoki pobór energii, szczególnie przy dużym obciążeniu. Obniżenie częstotliwości taktowania to tylko jeden ze sposobów walki z tym problemem.
Inne rozwiązanie opracowane przez AMD to zmniejszenie rozmiarów niektórych części układu oraz możliwość wyłączenia 25 procent każdego modułu pamięci podręcznej drugiego poziomu, gdy ta nie jest w całości potrzebna. Zmieniono także proces technologiczny z 32 do 28 nm, ale wbrew pozorom nie zostało to podyktowane chęcią oszczędzenia energii. Proces 32 nm jest procesem typu SOI (Silicon On Insulator), podczas gdy 28 nm to tzw. proces bulk. AMD zdecydowało się na wykorzystanie drugiego, ponieważ jest lepiej przystosowany do używania opracowanych przez Intela tranzystorów trójbramkowych, z których niebawem będzie korzystać także AMD.
Dodatkowo, w niektórych układach Kaveri AMD umożliwia zmianę współczynnika TDP (ang. Thermal Design Power). Jeśli w UEFI zmienimy wartość maksymalnej mocy np. z 65 do 45 W (jak w modelu A8–7600), komputer będzie pobierał mniej energii, choć kosztem niższej częstotliwości pracy i słabszej wydajności. Z rozwiązania tego powinny skorzystać osoby, które nie będą używały maszyny do grania lub innych skomplikowanych zadań.
Zupełnie nowy Radeon
O tym, jak ważnym elementem APU jest układ graficzny, może zaświadczyć fakt, że w przypadku Kaveri zajmuje on aż 47 proc. powierzchni całego układu. Firma AMD po raz pierwszy zdecydowała się na zastosowanie układu wykorzystującego architekturę Graphic Core Next, która jest stosowana w niektórych kartach graficznych Radeon HD 7000, a także R7 i R9.
Układy Kaveri, zależnie od wersji, są wyposażone w 6 lub 8 graficznych bloków obliczeniowych, z których każdy zawiera 64 procesory cieniujące. Oznacza to, że najszybszy zintegrowany układ graficzny AMD ma 512 jednostek cieniujących – tyle samo, ile kosztująca 300 zł karta Radeon HD 7750.
Nie oznacza to jednak, że zintegrowana grafika osiągnie pełnię wydajności swojego „zewnętrznego” odpowiednika, bo nie ma ona wbudowanej pamięci i musi korzystać z używanej przez procesor. Nawet bardzo wysoko taktowana pamięć DDR3 nie będzie w stanie osiągnąć pełni wydajności pamięci GDDR5 stosowanej w kartach graficznych.
Nowy Radeon wspiera najważniejsze interfejsy API, w tym DirectX 11.2 oraz Mantle. Jeśli ktoś by uznał, że jego wydajność jest niewystarczająca, może ją zwiększyć dzięki technologii Dual Graphics, czyli połączeniu zintegrowanej grafiki z kartą zewnętrzną Radeon R7 240 lub R7 250. Do tej pory podobne rozwiązania działały kiepsko, jednak teraz ma się to zmienić dzięki funkcji Frame Pacing (w sterownikach Catalyst 14.1 i nowszych).
Jeśli chodzi o możliwości multimedialne, zintegrowany układ graficzny prezentuje się świetnie. Ma moduły kodowania i dekodowania obsługujące nawet filmy 4K (do tej rozdzielczości potrafi też skalować filmy Full HD). Ponadto ma własny cyfrowy procesor dźwięku pozwalający na skorzystanie z technologii AMD TrueAudio.
HSA – wspólna pamięć dla wszystkich
Jednym z najciekawszych rozwiązań zastosowanych w układach Kaveri jest HSA (Heterogeneous System Architecture), w którego skład wchodzą dwa kolejne rozwiązania: hUMA (heterogenous Uniform Memory Access) oraz hQ (heterogeneous Queuing).
Pierwsze rozwiązanie sprawia, że różne jednostki obliczeniowe (CPU, układ graficzny) mają wspólną pamięć RAM, a nie jej wydzielone obszary. Mogą korzystać z całego obszaru pamięci i pracować na tej samej paczce danych, zatem unika się kopiowania danych między różnymi obszarami RAM.
Z kolei hQ powoduje, że wszystkie koprocesory (CPU i GPU) są sobie równe i mają taki sam priorytet dostępu do pamięci. Jest to podejście zupełnie nowe, gdyż do tej pory to procesor miał nadrzędną rolę w całym układzie. Teraz zintegrowany układ graficzny ma możliwość samodzielnego wyznaczania sobie kolejnych zadań i przekazywania ich bezpośrednio do procesora. Komunikacja obu koprocesorów jest rozwiązaniem niskopoziomowym, o wiele mniej zależnym od systemu operacyjnego niż do tej pory.
To zupełnie nowe podejście, zrównujące CPU i GPU, może dać znaczny wzrost wydajności. Według AMD w skrajnych przypadkach może on wynosić nawet 500 proc.
Nowe sterowniki
Udostępnione na początku lutego sterowniki AMD Catalyst 14.1 zapewniły wsparcie dla interfejsu Mantle. Na razie jedyną korzystającą z niego grą jest Battlefield 4, a przeprowadzone testy pokazują, że znacznie ogranicza on obciążenie procesora przez sterowniki. Oznacza to, że największy wzrost wydajności będzie można uzyskać w konfiguracji, w której procesor jest najsłabszym punktem komputera.
Korzyści z Mantle powinny być bardzo widoczne w rozgrywce wieloosobowej. Przykładem jest nie tylko Battlefield 4, ale też demo technologiczne Star Swarm napisane specjalnie z myślą o Mantle, symulujące działanie strategii czasu rzeczywistego, w której na ekranie widzimy nawet 5000 jednostek. Dlatego nad implementacją Mantle powinny się szczególnie zastanowić właśnie studia tworzące gry typu RTS.