TechnologieDobra klasa średnia

    Dobra klasa średnia

    Wiosną pojawiły się nowe procesory graficzne ATI Radeon HD 2900XT. Obecnie już kilkunastu producentów ma w ofercie karty graficzne korzystające z tego układu. Rywalizują z najlepszymi kartami średniej klasy i bez trudu je pokonują.

    Dobra klasa średnia

    Karty graficzne z układami ATI Radeon HD 2900 XT (kodowa nazwa R600) oferują między innymi firmy Asus, Gigabyte, MSI, HIS, Sapphire. Karty kosztują 1400–1550 zł. Ich bezpośrednią konkurencją są mocne karty ze średniej półki, korzystające z układu Nvidia GeForce 8800 GTS i wyposażone w 640 MB pamięci.

    Dla graczy karty z nowym układem ATI są niezwykle atrakcyjną propozycją. W większości przypadków wypadają lepiej od porównywalnej cenowo karty z GeForce’em 8800 GTS. Co więcej, w niektórych grach, np. UT2004 Assault, doganiają najszybsze karty z nowym procesorem Nvidia GeForce 8800 Ultra (kosztujące ok. 3000 zł)! Są to na razie sporadyczne sytuacje. Dopiero przygotowywana kolejna wersja układu ATI, o oznaczeniu prawdopodobnie HD 2900 XTX, będzie mogła na większym polu rywalizować z układem GeForce 8800 Ultra. Nie wiadomo jednak, kiedy się pojawi.

    Wśród nowości wprowadzonych w ATI Radeon HD 2900 XT do najważniejszych należą zunifikowane jednostki cieniowania, obsługa bibliotek graficznych DirectX10 oraz ciekawy sposób zarządzania pracą jednostek cieniujących oraz przepływem danych.

    64 jednostki cieniowania

    ATI Radeon HD 2900 XT, podobnie jak konkurencyjne GeForce’y, wykorzystuje ujednolicone, uniwersalne jednostki cieniowania (shadery). Jednostki te, w zależności od wymogów gry, mogą pełnić funkcję zarówno vertex shaderów (procesorów operujących na wierzchołkach), jak i pixel shaderów (procesorów, od których zależą działania na pikselach). Do niedawna procesor graficzny zawierał specjalizowane jednostki obu rodzajów.

    Układ ATI jest przystosowany do obsługi bibliotek DirectX 10. Aby jednak mógł sprostać wymogom stawianym przez nowe efekty graficzne, udostępniane przez te biblioteki, musi mieć odpowiednio dużą moc obliczeniową. Moc obliczeniowa zależy zaś od liczby jednostek obliczeniowych, które składają się na shadery. ATI Radeon HD 2900 XT ma 64 shadery, może więc jednocześnie pracować nad maksymalnie 64 algorytmami cieniowania. Trzeba dodać, że nazywanie tych małych procesorów shaderami jest dużym uproszczeniem. Można je bowiem obarczyć innymi zadaniami, np. obliczeniami związanymi z dźwiękiem przestrzennym czy wzajemnymi fizycznymi oddziaływaniami różnych obiektów na scenie w grze.

    Przeglądając specyfikację nowego układu graficznego ATI, dowiesz się, że zawiera on aż 320 jednostek obliczeniowych! Pamiętaj jednak, że owych 320 jednostek nie jest równoważne z liczbą shaderów, jak to mają w zwyczaju prezentować sprzedawcy. Dopiero połączenie ich w grupy (5 jednostek obliczeniowych + jedna jednostka skoków) daje pojedynczy procesor cieniujący – stąd w rzeczywistości HD 2900 XT ma 64 shadery. Dla jasności, podawana w przypadku układów konkurencyjnych liczba jednostek obliczeniowych – 96 dla GeForce 8800 GTS czy 128 dla GeForce 8800 GTX – również nie oznacza liczby shaderów. Dopiero połączone jednostki obliczeniowe, pracujące nad jednym efektem, tworzą pojedynczy shader. Liczba shaderów jest zatem dynamicznie modyfikowana i zależna od tego, ile elementarnych jednostek obliczeniowych będzie brało udział w obliczaniu poszczególnych efektów graficznych. To jest jedna z wielu różnic między konstrukcją firm ATI i Nvidia.

    Zarządzanie przepływem danych

    Do obsługi tak dużej liczby jednostek w układzie ATI został dodany osobny procesor (Ultra-Threaded Dispatch Processor), który zarządza przydzielaniem zadań jednostkom cieniującym i optymalizuje ten proces. Ciekawostką jest, że jednostki cieniujące nie muszą wykonywać zadania od początku do końca. Mogą zawieszać pracę nad wykonywaniem zadania z różnych przyczyn (np. oczekiwania na dane, które będą dopiero wyliczane), ale nie pozostają wtedy bezczynne. Procesor, który optymalizuje ich pracę, kontroluje setki równoległych wątków, których jest znacznie więcej niż shaderów. W razie przerwania pracy nad jednym zadaniem shader natychmiast otrzymuje inny wątek do wykonania. Ten poprzednio przerwany może dokończyć inny shader w późniejszym terminie. Dzięki takiemu rozwiązaniu żadna z jednostek nie „próżnuje” nawet przez chwilę, a procesor cały czas pracuje z maksymalną mocą obliczeniową.

    Ważną modyfikacją jest zastosowanie 512-bitowej, wewnętrznej pierścieniowej szyny pamięci, służącej do komunikacji między układem a pamięcią RAM karty graficznej. Szyna pracuje w trybie full duplex, zatem w jednym czasie może jednocześnie odbierać i wysyłać dane. Teoretycznie więc jej szerokość to 1024 bity. Rozwiązanie to zapewnia płynne (bez opóźnień) przesyłanie danych między procesorem graficznym a pamięcią RAM karty, gdyż dostęp do każdego shadera zapewnia indywidualne pasmo (patrz ramka „Komunikacja układu ATI z pamięcią RAM karty graficznej”).

    Wydajność dziś i w przyszłości

    Do porównania wydajności układów Radeon HD 2900 XT i bezpośredniego konkurenta GeForce 8800 GTS nie wystarczy zestawienie ich parametrów (liczby jednostek obliczeniowych i shaderów, częstotliwości zegarów i wielkości pamięci). Przede wszystkim dlatego, że układy te mają odmienne struktury. Obecnie wydajność karty w grach zależy w dużym stopniu od jakości jej sterowników. Tymczasem te do kart z procesorem Radeon HD 2900 XT są jeszcze niedopracowane. Drugim czynnikiem decydującym o osiągach karty jest to, w jakim stopniu dana gra jest przystosowana do obsługi konkretnego procesora graficznego. W wielu grach, także tych najnowszych, karty z procesorem ATI HD 2900 XT zdecydowanie przewyższają karty z GeForce 8800 GTS 640 MB. Są jednak gry, w których konstrukcja ATI wypada znacznie słabiej (np. Far Cry z włączonym wygładzaniem krawędzi).

    Wyniki te nie są jednak jednoznaczne. Zarówno układy ATI, jak i Nvidia zostały przygotowane z myślą o grach wykorzystujących biblioteki graficzne DirectX 10 . Ponieważ takich gier jest na razie niewiele, układy te działają najwyżej na „pół gwizdka”. Poza tym producenci gier – aby zapewnić ich zbyt – przygotowują je tak, by dobrze działały zarówno na komputerach nowych, jak i nieco starszych. Nie są więc optymalnie dostosowane do współpracy z kartami, które obsługują DirectX 10. Minie sporo czasu, zanim powstaną gry, które będą wykorzystywać w pełni możliwości nowych kart. I wtedy dopiero będzie można rzetelnie oceniać ich wydajność.

    Obraz

    Moim zdaniem

    • Sebastian Kręzel Redaktor działu Hardware

    Kolejne przesunięcia premiery najnowszych procesorów graficznych ATI rodziły wątpliwości, czy w ogóle się pojawią. Watpliwości pogłębiło przejęcie firmy ATI przez korporację AMD. Wreszcie procesory oraz bazujące na nich karty ukazały się i… zaskoczyły zwłaszcza graczy. Dlaczego? Dotychczas nowe procesory graficzne, a właściwie bazujące na nich karty graficzne, ukazywały się najpierw w najmocniejszych odmianach. Niestety, nowa karta z układem AMD/ATI nie była na tyle wydajna, aby rywalizować z najszybszymi kartami bazującymi na procesorach graficznych konkurenta, czyli Nvidii. AMD/ATI ogłosiło zatem, że jest to topowa karta, ale ze średniego pułapu cenowego! Pierwszy raz na rynku taka sytuacja miała miejsce. Może to oznaczać, że chwilowo AMD/ATI nie jest w stanie wyprodukować układu, mogącego konkurować z superwydajnymi układami z najwyższej półki. Jednak nawet jeśli tak jest, to na rynku układów średniej klasy mocno popsuje szyki Nvidii.

    Programowalne jednostki w ATI Radeon HD 2900 XT

    Programowalne jednostki w ATI Radeon HD 2900 XT W układzie ATI w pracach nad przetwarzaniem obrazu bierze udział znacznie więcej programowalnych jednostek niż do tej pory. Najważniejsze z nich to:

    • Jednostka wstępnego przetwarzania (setup engine) – odpowiada za wstępne przetworzenie i posortowanie informacji o otrzymanej scenie z gry; w układzie tym znajduje się też jednostka tesselacji , która na podstawie zadanego algorytmu potrafi z prostego obiektu uczynić obiekt o bardzo złożonej siatce, a więc o większej liczbie detali.
    • Wielowątkowy procesor przydzielania zadań (Ultra-Threaded Dispatch Processor) – kontroluje liczbę pobranych zadań oraz dba o trwałe obciążenie shaderów.
    • 64 zunifikowane jednostki cieniowania (shadery) – specjalizowane procesory, od których zależy przetwarzanie otrzymywanych informacji zgodnie z zadanymi algorytmami.
    • Cztery jednostki teksturowania – procesory wstępnie opracowujące tekstury, które są przekazywane jednostkom cieniującym; jeden procesor tekstur przypisany jest do 16 shaderów zgrupowanych w jeden blok.
    • Jednostki wykańczające – zanim przeliczone informacje zostaną przesłane do pamięci karty graficznej, układy wykańczające dodają jeszcze efekty mgły i przezroczystości; ponadto zajmują się wygładzaniem krawędzi sceny.
    • Pierścieniowa szyna pamięci – 512-bitowa szyna pamięci działająca w trybie pełnego dupleksu (jednoczesny odczyt i zapis danych).

    Wybrane dla Ciebie