Cel integracji
|
Zabieg ujednolicania różnych
typów jednostek obliczeniowych stosuje się od kilku lat. Celem jest doprowadzenie do pełnego wykorzystania udostępnianej mocy obliczeniowej i zapobieganie sytuacji, kiedy jeden rodzaj jednostek „nudzi się”, oczekując na dane przetwarzane przez inne jednostki. Przykładem jest unifikacja jednostek cieniowania pikseli (pixel shader) i wierzchołków (vertex shader) w najnowszych układach graficznych.
W układach, w których były oba rodzaje jednostek, często zdarzało się, że pixel shadery były wykorzystywane w pełni, a vertex shadery w minimalnym stopniu. Uniwersalne shadery mogą operować na wielu typach danych – w zależności od wymagań aplikacji mogą obliczać kod pisany zarówno dla jednostek cieniowania pikseli, jak i wierzchołków.
|
W naszych komputerach najczęściej znajdują się dwie jednostki przetwarzania. Pierwszą jest procesor główny, czyli CPU (Central Processing Unit), a drugą – procesor graficzny GPU (Graphics Processing Unit). Układy te mają wiele podobnych cech – m.in. oba muszą korzystać z pamięci o dużej przepustowości, pojemności i krótkich opóźnieniach. To właśnie podobieństwa umożliwiają integrację obu procesorów. Dzięki niej procesor graficzny będzie mógł przejąć różne zadania od procesora i na odwrót. Efektem ma być wzrost wydajności (m.in. w grach) komputerów wyposażonych w procesor z grafiką, szczególnie w porównaniu z pecetami korzystającymi z grafiki zintegrowanej z płytą główną.
Przewidywane korzyści z połączenia GPU z CPU
|
- dużo wyższa wydajność niż grafiki zintegrowanej z płytą główną
- porównywalna wydajność z kartami grafiki ze średniej półki przy niższej cenie zakupu
- miniaturyzacja komputerów
|
Wszechstronne GPU
Przejmowanie przez procesor graficzny pewnych zadań jednostki centralnej nie jest nowym pomysłem. Najnowsze układy graficzne firmy AMD wykorzystują tzw. przetwarzanie strumieniowe, czyli równoległą obróbkę danych przez zespół wyspecjalizowanych jednostek (shaderów ). Dzięki temu układ graficzny może się zajmować jednocześnie generowaniem trójwymiarowego obrazu (renderingiem) oraz innymi zadaniami.
Na przykład w ogólnoświatowym programie Folding@Home (uruchomionym przez Uniwersytet Stanforda) internauci dysponujący komputerem z kartą grafiki Radeon X1900 podczas korzystania ze swojej maszyny wykonują na niej jednocześnie skomplikowane symulacje biochemiczne, mające pomóc w znalezieniu lekarstwa na choroby nowotworowe.
Technologiczny rozwój procesora
|
|
Ewolucja możliwości procesorów o architekturze x86 postępuje wolno. W 1989 roku w procesor wbudowano jednostkę zmiennoprzecinkową FP, wspierającą CPU w skomplikowanych obliczeniach. W latach 90. ubiegłego stulecia dodano kilkadziesiąt nowych rozkazów, zebranych w multimedialne instrukcje MMX i SSE . Rewolucją było pojawienie się pierwszych 64-bitowych procesorów AMD. Kolejny krok to integracja z procesorem jednostek graficznych.
|
Innym pomysłem jest wykorzystanie GPU do obliczania skomplikowanych efektów fizycznych, np. zjawisk atmosferycznych, oraz symulowania zachowań wirtualnych przeciwników w grach. Rozwiązania tego typu (mówiło się o nich już ponad dwa lata temu) nie mają wersji komercyjnych, znalazły się jedynie w demach koncepcyjnych producentów układów graficznych – ATI (obecnie AMD) oraz Nvidia.
Nvidia zapowiedziała też rozwiązanie 3-way SLI, umożliwiające wykorzystanie trzech kart graficznych w jednym komputerze. Na razie służy ono jedynie do zwiększania wydajności grafiki, ale być może już niedługo jeden z akceleratorów przejmie od procesora głównego kilka dodatkowych zadań, np. symulacje występujących w świecie rzeczywistym sił fizycznych.
Architektura układu Fusion
W ramach projektu Fusion dwie osobne jednostki obliczeniowe – tradycyjny procesor i układ graficzny – zostaną umieszczone w jednej strukturze krzemowej, a obudowa nowego układu będzie taka jak obudowa procesora. Jednostki te będą korzystały ze wspólnej bądź rozdzielnej pamięci podręcznej (lub bufora ). Układy będą połączone przez przełącznik krzyżowy i wspólny kontroler pamięci . Obie jednostki mają korzystać z tej samej pamięci RAM . Obawy, że będzie jej za mało, by oba układy działały sprawnie, nie muszą się sprawdzić, gdy bierzemy pod uwagę procesory AMD (gorzej byłoby w przypadku Intela). Same procesory AMD nie wymagają dużej przepustowości pamięci. Dzięki temu zostaje jej więcej dla układu graficznego.
Co więcej, według testów wykonanych w laboratorium PC Formatu, różnica wydajności tych samych procesorów AMD przy zastosowaniu pamięci RAM: DDR 400 i szybszej DDR2 800 jest niewielka. Oznacza to, że im szybsza pamięć, tym większą jej przepustowość będzie miał do dyspozycji układ graficzny. Ponieważ pod koniec bieżącego roku pojawią się pamięci DDR3 o znacznie wyższej przepływności niż dotychczasowe układy DDR2, zintegrowany z CPU procesor graficzny zyska spory zapas.