TechnologieCo pokaże AMD

    Co pokaże AMD

    Od dwóch lat wydajność kolejnych procesorów Intela i AMD do komputerów osobistych niewiele się różni od oferowanej przez sprzedawane już układy. Zmiany dotyczą głównie sposobu wytwarzania. Inaczej ma być z procesorami AMD, zapowiadanymi na drugą połowę roku. Będą o 15 proc. szybsze od obecnych.

    Co pokaże AMD

    Pamięci podręczne

    Pamięć podręczna służy do skrócenia czasu oczekiwania procesora na dane z pamięci operacyjnej RAM.

    • Pamięć pierwszego poziomu (cache L1) jest najszybsza, typowe opóźnienia to 2–3 takty, ale ma najmniejszą pojemność 16–128 KB. Często jest osobna dla instrukcji i dla danych.
    • Pamięć poziomu drugiego (cache L2) jest wolniejsza, typowe opóźnienie to 9–13 taktów, ale ma większą pojemność, 128–6144 KB. W procesorach wielordzeniowych może być oddzielna dla każdego rdzenia lub wspólna dla wszystkich.
    • Pamięć podręczna poziomu trzeciego (cache L3) jest jeszcze wolniejsza – typowe opóźnienia to 20–30 taktów, ale ma większą pojemność – od 2 do 12 MB.

    Czterordzeniowe procesory AMD Phenom X4, które trafiły na rynek pod koniec 2007 r., mają bardziej złożoną konstrukcję niż układy konkurencji. Marny to powód do dumy, skoro na listach najwydajniejszych procesorów pierwsze miejsca okupują produkty Intela.

    Specjaliści przewidują jednak, że architektura Phenom umożliwi AMD zwiększenie wydajności jej przyszłych układów przy zachowaniu częstotliwości pracy obecnych procesorów. Zapowiadany na drugą połowę roku procesor AMD Shang-hai ma działać o 15 proc. szybciej niż współczesne układy.

    Shanghai zapoczątkuje też przejście do procesu wytwarzania w technologii 45 nm zamiast 65 nm. Pozwoli to ograniczyć zużycie energii o 30 proc. – do poziomu, jaki już teraz zapewniają procesory Intela.

    Phenomy – dziś...

    W architekturze Phenoma zlikwidowano większość ograniczeń, które występowały w poprzedniej generacji procesorów AMD, czyli Athlonów 64 X2. Rdzeń szybciej pobiera potrzebne dane z pamięci podręcznej, bo jest z nią połączony szeroką 256-bitową szyną. Pozwala to przesyłać dwie 128-bitowe porcje danych jednocześnie. Phenomy potrafią też wykonać więcej zadań w czasie jednego taktu zegara – nawet do 4 operacji zmiennoprzecinkowych i większość instrukcji multimedialnych. Dzięki temu programy użytkownika są wykonywane szybciej mimo takiej samej częstotliwości taktowania procesora Phenom jak Athlon 64 X2.

    Procesory czterordzeniowe AMD wytwarzane w różnych technologiach

    Wraz ze zmianą technologii produkcji czterordzeniowych procesorów AMD z 65 nm na 45 nm będzie można zmieścić na mniejszej powierzchni więcej tranzystorów – w Barcelonie jest ich 463 mln, a w procesorze Shanghai będzie ich 705 mln. Zmniejszy się wielkość rdzeni procesora (1), a pamięć podręczna cache L3 – wspólna dla wszystkich rdzeni – zwiększy się z 2 MB (2) do 6 MB (3). Spowoduje to wzrost wydajności procesora w większości aplikacji, ponieważ procesor będzie musiał rzadziej sięgać po dane do wolniejszej pamięci RAM.

    Phenomy wykorzystują rozbudowany układ wstępnego pobierania danych. Ładuje on do pamięci podręcznej odpowiednie dane, zanim procesor będzie ich potrzebował. Zmniejsza to opóźnienia w dostępie do danych. Z kolei wydłużona kolejka instrukcji do wykonania sprawia, że jednostki wykonawcze procesora mają mniej przestojów.

    Rozszerzony zestaw instrukcji multimedialnych w obecnych Phenomach przyspiesza też przetwarzanie strumieni danych, wykonanie operacji szyfrowania i związanych z bezpieczeństwem aplikacji.

    Problem jest jednak z obniżeniem zużycia energii. Najszybszy procesor AMD, Phenom X4 9850 2,5 GHz, w czasie pracy z pełnym obciążeniem, np. przy konwersji wideo wysokiej jakości, pobiera ok. 30 W więcej energii niż porównywalny z nim układ Intela. Nawet po włączeniu funkcji oszczędzania energii, np. przy surfowaniu, zużywa o kilka wat więcej niż procesor konkurencji.

    ... i w przyszłości

    Wszystkie rozwiązania architektury Phenom, które przyspieszają działanie procesorów, znajdą się też w dwurdzeniowym procesorze Phenom (Kuma), który ma trafić do sprzedaży najpóźniej w III kwartale br. Producent zapewnia, że będzie o ok. 15 proc. wydajniejszy od Athlona 64 X2 z tym samym zegarem.

    Przenosząc produkcję procesorów czterordzeniowych do procesu 45 nm, AMD zamierza zwiększyć pamięć podręczną trzeciego poziomu z 2 MB do 6 MB. Poprawi to wydajność układów o takiej samej częstotliwości o około 10–15 proc., ponieważ procesor będzie rzadziej sięgał po dane do wolniejszej pamięci RAM. Pierwszy procesor z cache L3 6 MB – Shanghai – pojawi się jeszcze w tym roku.

    W kolejnych generacjach produktów AMD będzie wprowadzonych ponad 80 nowych instrukcji multimedialnych, które przyspieszą pracę programów przetwarzających grafikę i dźwięk oraz szyfrujących dane.

    Oszczędzanie energii

    Zastosowana w procesorach AMD Phenom funkcja oszczędzania energii umożliwia dokładniejsze niż w Athlonach zarządzanie pracą i wyłączaniem poszczególnych układów. Pojawił się nowy tryb czuwania C1E. Włącza się, gdy wszystkie rdzenie procesora są nieaktywne, i zapewnia szybkie przejście do stanu pełnej wydajności, gdy zażąda tego aplikacja. Układy regulacji napięcia dostają sygnał informujący o niższym zapotrzebowaniu na energię, dzięki czemu mogą odpowiednio zareagować.

    Zmianą stanów wydajności steruje procesor. Zegar sterujący nie jest zatrzymywany, co ma miejsce w innych architekturach. Skraca to czas przełączania między poszczególnymi stanami, a jednym z efektów jest np. płynniejsze odtwarzanie dźwięku lub wideo.

    Przejście na nowocześniejszą technologię wytwarzania pozwala zwiększyć częstotliwość pracy procesora i zredukować zapotrzebowanie na energię. Swego czasu zmiana procesu z 90 nm na 65 nm pozwoliła AMD wprowadzić do sprzedaży procesory pracujące z częstotliwością 2,4 GHz, których współczynnik TDP (Thermal Design Power – moc, jakiej potrzebuje system chłodzenia do odprowadzenia ciepła z układu) miał wartość 45 W, podczas gdy ich odpowiedniki w technologii 90 nm miały TDP o wartości 65 W.

    Można się spodziewać, że współczynnik TDP procesorów AMD wytwarzanych w procesie 45 nm będzie dużo niższy. AMD współpracuje również z IBM-em nad kolejnymi generacjami technologii wytwarzania procesorów, a efektem ma być zastosowanie materiałów o dużej wartości stałej dielektrycznej, które pozwolą jeszcze bardziej ograniczyć pobór energii.

    W pogoni za przepustowością

    Obraz

    Procesory AMD od 2003 r. zawierają zintegrowany kontroler pamięci, który zarządza komunikacją między procesorem a pamięcią RAM. Jest on dostosowany do układów DDR i DDR2, dostępnych w dobrych cenach. Kolejne generacje pamięci DDR mają coraz większe przepustowości, są bardziej energooszczędne. Charakteryzują się coraz większymi częstotliwościami, ale mają też coraz bardziej rozbudowane konstrukcje. Wydłuża to czas dostępu do komórek pamięci o kolejne takty, tyle że takty te są coraz krótsze ze względu na większą częstotliwość. W efekcie procesor oczekuje na rozpoczęcie przesyłania danych tyle samo czasu, niezależnie od zastosowanej generacji pamięci, za to samo przesyłanie jest dużo szybsze.

    Zintegrowany kontroler pamięci działa tym efektywniej, im krótsze są czasy dostępu do pamięci. Jednak AMD nie spieszy się z wprowadzaniem procesorów obsługujących najnowsze, szybkie pamięci DDR3. Kontroler pamięci zintegrowany w procesorach Phenom jest technicznie przygotowany do ich obsługi, ale okazuje się, że na razie układy DDR2 zapewniają wystarczającą szybkość przesyłania danych. Dopiero w 2009 r. do sprzedaży mają trafić procesory z podstawką AM3, dostosowane do DDR3. Nowe procesory będzie też można zastosować w podstawce AM2+, która obecnie znajduje się w Phenomach. Nie będzie to optymalne połączenie, ale pozwoli na stopniową rozbudowę komputera bez konieczności jednoczesnej wymiany procesora, płyty głównej oraz pamięci.

    Mnożenie jąder

    Osiem rdzeni w postaci pojedynczego układu scalonego mają zawierać procesory AMD Opteron trzeciej generacji (Sandtiger), zapowiadane na 2009/2010. Wymagałoby to jednak od AMD przejścia na proces produkcyjny 32 nm, co jest mało prawdopodobne. Wydaje się, że szybciej pojawią się 6-rdzeniowe procesory Sao Paolo. Następnie dwa takie układy zostaną połączone za pomocą chipsetu i powstanie 12-rdzeniowy procesor Magny-Cours. Jeśli plany się powiodą, najpierw ujrzą światło dzienne wersje serwerowe procesorów, bo tam ich możliwości będzie łatwiej wykorzystać. Można się spodziewać, że takie procesory lub te łączące dwa układy 4-rdzeniowe zagoszczą również w popularnych komputerach. Nie wcześniej jednak niż przed 2010 r.

    AMD pracuje także nad procesorem Bobcat, którego TDP ma wynosić od 1 do 10 W. Będzie to uproszczony procesor, pracujący przy niskim zasilaniu, przeznaczony przede wszystkim do urządzeń typu Ultra Mobile PC, One Laptop Per Child (jak Asus Eee), Pocket PC.

    Grafika – w procesorze

    Obraz

    Integracja układu przetwarzającego grafikę GPU w procesorze głównym CPU to kolejny projekt AMD (Fusion). W porównaniu ze współczesnymi złożonymi GPU o ograniczonej wydajności będzie to raczej uproszczony układ. Po co więc go stosować? Bo dzięki niemu komputer będzie zużywał mniej energii, producent więcej zarobi, a użytkownik zapłaci mniej niż za oddzielną kartę grafiki. Integracja układów do szybkiego przetwarzania danych strumieniowych, np. nagrań wideo czy muzyki, pozwala odciążyć od tych zadań CPU, co wydłuży czas pracy na baterii, ograniczy ilość wytwarzanego ciepła oraz spowoduje, że komputery będą cichsze.

    Pierwszą realizacją projektu Fusion ma być procesor Bulldozer. Spekuluje się, że jego wydajność będzie około 2 razy większa niż obecnie sprzedawanych produktów w przypadku aplikacji niezoptymalizowanych i jeszcze większa dla zoptymalizowanych.

    Wybrane dla Ciebie