Pamięci podręczne
|
Pamięć podręczna służy do skrócenia czasu oczekiwania procesora na dane z pamięci operacyjnej RAM.
- Pamięć pierwszego poziomu (cache L1) jest najszybsza, typowe opóźnienia to 2–3 takty, ale ma najmniejszą pojemność 16–128 KB. Często jest osobna dla instrukcji i dla danych.
- Pamięć poziomu drugiego (cache L2) jest wolniejsza, typowe opóźnienie to 9–13 taktów, ale ma większą pojemność, 128–6144 KB. W procesorach wielordzeniowych może być oddzielna dla każdego rdzenia lub wspólna dla wszystkich.
- Pamięć podręczna poziomu trzeciego (cache L3) jest jeszcze wolniejsza – typowe opóźnienia to 20–30 taktów, ale ma większą pojemność – od 2 do 12 MB.
|
Czterordzeniowe procesory AMD Phenom X4, które trafiły na rynek pod koniec 2007 r., mają bardziej złożoną konstrukcję niż układy konkurencji. Marny to powód do dumy, skoro na listach najwydajniejszych procesorów pierwsze miejsca okupują produkty Intela.
Specjaliści przewidują jednak, że architektura Phenom umożliwi AMD zwiększenie wydajności jej przyszłych układów przy zachowaniu częstotliwości pracy obecnych procesorów. Zapowiadany na drugą połowę roku procesor AMD Shang-hai ma działać o 15 proc. szybciej niż współczesne układy.
Shanghai zapoczątkuje też przejście do procesu wytwarzania w technologii 45 nm zamiast 65 nm. Pozwoli to ograniczyć zużycie energii o 30 proc. – do poziomu, jaki już teraz zapewniają procesory Intela.
Phenomy – dziś...
W architekturze Phenoma zlikwidowano większość ograniczeń, które występowały w poprzedniej generacji procesorów AMD, czyli Athlonów 64 X2. Rdzeń szybciej pobiera potrzebne dane z pamięci podręcznej, bo jest z nią połączony szeroką 256-bitową szyną. Pozwala to przesyłać dwie 128-bitowe porcje danych jednocześnie. Phenomy potrafią też wykonać więcej zadań w czasie jednego taktu zegara – nawet do 4 operacji zmiennoprzecinkowych i większość instrukcji multimedialnych. Dzięki temu programy użytkownika są wykonywane szybciej mimo takiej samej częstotliwości taktowania procesora Phenom jak Athlon 64 X2.
Procesory czterordzeniowe AMD wytwarzane w różnych technologiach
|
|
Wraz ze zmianą technologii produkcji czterordzeniowych procesorów AMD z 65 nm na 45 nm będzie można zmieścić na mniejszej powierzchni więcej tranzystorów – w Barcelonie jest ich 463 mln, a w procesorze Shanghai będzie ich 705 mln. Zmniejszy się wielkość rdzeni procesora (1), a pamięć podręczna cache L3 – wspólna dla wszystkich rdzeni – zwiększy się z 2 MB (2) do 6 MB (3). Spowoduje to wzrost wydajności procesora w większości aplikacji, ponieważ procesor będzie musiał rzadziej sięgać po dane do wolniejszej pamięci RAM.
|
Phenomy wykorzystują rozbudowany układ wstępnego pobierania danych. Ładuje on do pamięci podręcznej odpowiednie dane, zanim procesor będzie ich potrzebował. Zmniejsza to opóźnienia w dostępie do danych. Z kolei wydłużona kolejka instrukcji do wykonania sprawia, że jednostki wykonawcze procesora mają mniej przestojów.
Rozszerzony zestaw instrukcji multimedialnych w obecnych Phenomach przyspiesza też przetwarzanie strumieni danych, wykonanie operacji szyfrowania i związanych z bezpieczeństwem aplikacji.
Problem jest jednak z obniżeniem zużycia energii. Najszybszy procesor AMD, Phenom X4 9850 2,5 GHz, w czasie pracy z pełnym obciążeniem, np. przy konwersji wideo wysokiej jakości, pobiera ok. 30 W więcej energii niż porównywalny z nim układ Intela. Nawet po włączeniu funkcji oszczędzania energii, np. przy surfowaniu, zużywa o kilka wat więcej niż procesor konkurencji.
... i w przyszłości
Wszystkie rozwiązania architektury Phenom, które przyspieszają działanie procesorów, znajdą się też w dwurdzeniowym procesorze Phenom (Kuma), który ma trafić do sprzedaży najpóźniej w III kwartale br. Producent zapewnia, że będzie o ok. 15 proc. wydajniejszy od Athlona 64 X2 z tym samym zegarem.
Przenosząc produkcję procesorów czterordzeniowych do procesu 45 nm, AMD zamierza zwiększyć pamięć podręczną trzeciego poziomu z 2 MB do 6 MB. Poprawi to wydajność układów o takiej samej częstotliwości o około 10–15 proc., ponieważ procesor będzie rzadziej sięgał po dane do wolniejszej pamięci RAM. Pierwszy procesor z cache L3 6 MB – Shanghai – pojawi się jeszcze w tym roku.
W kolejnych generacjach produktów AMD będzie wprowadzonych ponad 80 nowych instrukcji multimedialnych, które przyspieszą pracę programów przetwarzających grafikę i dźwięk oraz szyfrujących dane.
Oszczędzanie energii
Zastosowana w procesorach AMD Phenom funkcja oszczędzania energii umożliwia dokładniejsze niż w Athlonach zarządzanie pracą i wyłączaniem poszczególnych układów. Pojawił się nowy tryb czuwania C1E. Włącza się, gdy wszystkie rdzenie procesora są nieaktywne, i zapewnia szybkie przejście do stanu pełnej wydajności, gdy zażąda tego aplikacja. Układy regulacji napięcia dostają sygnał informujący o niższym zapotrzebowaniu na energię, dzięki czemu mogą odpowiednio zareagować.
Zmianą stanów wydajności steruje procesor. Zegar sterujący nie jest zatrzymywany, co ma miejsce w innych architekturach. Skraca to czas przełączania między poszczególnymi stanami, a jednym z efektów jest np. płynniejsze odtwarzanie dźwięku lub wideo.
Przejście na nowocześniejszą technologię wytwarzania pozwala zwiększyć częstotliwość pracy procesora i zredukować zapotrzebowanie na energię. Swego czasu zmiana procesu z 90 nm na 65 nm pozwoliła AMD wprowadzić do sprzedaży procesory pracujące z częstotliwością 2,4 GHz, których współczynnik TDP (Thermal Design Power – moc, jakiej potrzebuje system chłodzenia do odprowadzenia ciepła z układu) miał wartość 45 W, podczas gdy ich odpowiedniki w technologii 90 nm miały TDP o wartości 65 W.
Można się spodziewać, że współczynnik TDP procesorów AMD wytwarzanych w procesie 45 nm będzie dużo niższy. AMD współpracuje również z IBM-em nad kolejnymi generacjami technologii wytwarzania procesorów, a efektem ma być zastosowanie materiałów o dużej wartości stałej dielektrycznej, które pozwolą jeszcze bardziej ograniczyć pobór energii.