Zupełnie nowy Radeon
O tym, jak ważnym elementem APU jest układ graficzny, może zaświadczyć fakt, że w przypadku Kaveri zajmuje on aż 47 proc. powierzchni całego układu. Firma AMD po raz pierwszy zdecydowała się na zastosowanie układu wykorzystującego architekturę Graphic Core Next, która jest stosowana w niektórych kartach graficznych Radeon HD 7000, a także R7 i R9.
Układy Kaveri, zależnie od wersji, są wyposażone w 6 lub 8 graficznych bloków obliczeniowych, z których każdy zawiera 64 procesory cieniujące. Oznacza to, że najszybszy zintegrowany układ graficzny AMD ma 512 jednostek cieniujących – tyle samo, ile kosztująca 300 zł karta Radeon HD 7750.
Nie oznacza to jednak, że zintegrowana grafika osiągnie pełnię wydajności swojego „zewnętrznego” odpowiednika, bo nie ma ona wbudowanej pamięci i musi korzystać z używanej przez procesor. Nawet bardzo wysoko taktowana pamięć DDR3 nie będzie w stanie osiągnąć pełni wydajności pamięci GDDR5 stosowanej w kartach graficznych.
Nowy Radeon wspiera najważniejsze interfejsy API, w tym DirectX 11.2 oraz Mantle. Jeśli ktoś by uznał, że jego wydajność jest niewystarczająca, może ją zwiększyć dzięki technologii Dual Graphics, czyli połączeniu zintegrowanej grafiki z kartą zewnętrzną Radeon R7 240 lub R7 250. Do tej pory podobne rozwiązania działały kiepsko, jednak teraz ma się to zmienić dzięki funkcji Frame Pacing (w sterownikach Catalyst 14.1 i nowszych).
Jeśli chodzi o możliwości multimedialne, zintegrowany układ graficzny prezentuje się świetnie. Ma moduły kodowania i dekodowania obsługujące nawet filmy 4K (do tej rozdzielczości potrafi też skalować filmy Full HD). Ponadto ma własny cyfrowy procesor dźwięku pozwalający na skorzystanie z technologii AMD TrueAudio.
HSA – wspólna pamięć dla wszystkich
Jednym z najciekawszych rozwiązań zastosowanych w układach Kaveri jest HSA (Heterogeneous System Architecture), w którego skład wchodzą dwa kolejne rozwiązania: hUMA (heterogenous Uniform Memory Access) oraz hQ (heterogeneous Queuing).
Pierwsze rozwiązanie sprawia, że różne jednostki obliczeniowe (CPU, układ graficzny) mają wspólną pamięć RAM, a nie jej wydzielone obszary. Mogą korzystać z całego obszaru pamięci i pracować na tej samej paczce danych, zatem unika się kopiowania danych między różnymi obszarami RAM.
Z kolei hQ powoduje, że wszystkie koprocesory (CPU i GPU) są sobie równe i mają taki sam priorytet dostępu do pamięci. Jest to podejście zupełnie nowe, gdyż do tej pory to procesor miał nadrzędną rolę w całym układzie. Teraz zintegrowany układ graficzny ma możliwość samodzielnego wyznaczania sobie kolejnych zadań i przekazywania ich bezpośrednio do procesora. Komunikacja obu koprocesorów jest rozwiązaniem niskopoziomowym, o wiele mniej zależnym od systemu operacyjnego niż do tej pory.
To zupełnie nowe podejście, zrównujące CPU i GPU, może dać znaczny wzrost wydajności. Według AMD w skrajnych przypadkach może on wynosić nawet 500 proc.
Nowe sterowniki
Udostępnione na początku lutego sterowniki AMD Catalyst 14.1 zapewniły wsparcie dla interfejsu Mantle. Na razie jedyną korzystającą z niego grą jest Battlefield 4, a przeprowadzone testy pokazują, że znacznie ogranicza on obciążenie procesora przez sterowniki. Oznacza to, że największy wzrost wydajności będzie można uzyskać w konfiguracji, w której procesor jest najsłabszym punktem komputera.
Korzyści z Mantle powinny być bardzo widoczne w rozgrywce wieloosobowej. Przykładem jest nie tylko Battlefield 4, ale też demo technologiczne Star Swarm napisane specjalnie z myślą o Mantle, symulujące działanie strategii czasu rzeczywistego, w której na ekranie widzimy nawet 5000 jednostek. Dlatego nad implementacją Mantle powinny się szczególnie zastanowić właśnie studia tworzące gry typu RTS.