Architektura i wydajność
Od wydajności procesora zależy, jak szybko komputer przetwarza dane i czy wygodnie się z niego korzysta. A że nasze wymagania wobec peceta rosną, niezbędne są coraz szybsze i bogatsze w funkcje procesory, takie jak Intel Core i7 oraz AMD Phenom II. Oto, jakie zmiany wprowadzili w nich producenci, by zwiększyć ich wydajność oraz zmniejszyć zużycie energii.
Płyty do Core i7
Wbudowany kontroler pamięci DDR3 oraz zastosowanie nowej magistrali systemowej wymogły opracowanie nowej podstawki do montażu procesorów Intel Core i7 na płycie głównej – LGA 1366. Nie pasuje ona do starszych gniazd LGA 775. Wraz z serią Core i7 pojawiły się nowe chipsety X58 Express i zbudowane na ich bazie płyty główne. W chipsetach X58 zaimplementowano obsługę połączonych kart graficznych Nvidia (technologia SLI). Do niedawna procesory Intela współpracowały tylko z połączonymi kartami ATI (technologia CrossFire).
Procesor Intel Core i7 pojawił się na rynku pod koniec 2008 roku, natomiast AMD Phenom II miał premierę 8 stycznia 2009 roku. Są to procesory czterordzeniowe. Produkuje się je w technologii 45 nm, która zapewnia niski pobór mocy, ok. 130 W, oraz pozwala zmniejszyć ilość wydzielanego ciepła przy zapewnieniu jednoczesnych dużych prędkości pracy układów. W przypadku AMD są to pierwsze procesory wytwarzane w tej technologii.
Na polskim rynku można kupić obecnie procesory Intel Core i7 pracujące z częstotliwością 2,66 GHz (Core i7 920 za ok. 1200 zł), 2,93 GHz (Core i7 940 za ok. 2100 zł) i 3,2 GHz (Core i7 965 Extreme Edition za ok. 3700 zł). Dostępne procesory Phenom II pracują z zegarem 3 GHz (X4 940 za ok. 1000 zł) oraz 2,8 GHz (X4 920 za ok. 850 zł).
Najważniejsze cechy nowych procesorów to zintegrowany kontroler pamięci – przyspiesza wymianę danych miedzy procesorem a pamięcią operacyjną RAM, oraz duża pamięć podręczna trzeciego poziomu – pozwala z wyprzedzeniem pobierać dane, których potrzebuje uruchomiona na komputerze aplikacja. Te i wiele innych zmian sprawiają, że komputer z nowym procesorem będzie sobie radził nie tylko ze standardowymi zadaniami, jak obsługa edytora tekstu, programu pocztowego czy wyświetlanie zawartości większości stron WWW, ale też pozwoli sprawniej niż dotychczas przetwarzać nagrania wysokiej jakości z kamerki cyfrowej, odtwarzać filmy HD czy odpalać najnowsze gry.
Intel Core i7 – zaprojektowany niemal od nowa
W stosunku do poprzedników, układów Core 2 Duo i Quad Core, procesor Core i7 został mocno zmieniony i w znacznej mierze zaprojektowany od nowa. Współpracuje tylko z pamięciami DDR3 i wymaga płyty głównej z nowym gniazdkiem.
Pamięć i magistrala
Z punktu widzenia użytkownika jedną z najważniejszych zmian w architekturze Intel Core i7 jest przeniesienie kontrolera pamięci z układu instalowanego na płycie głównej wprost do procesora. Kontroler pamięci zapewnia komunikację procesora z pamięcią operacyjną RAM. Dzięki temu, że znajduje się w procesorze, odczyt i zapis danych z oraz do pamięci RAM jest znacznie szybszy, co przekłada się na bardziej wydajną pracę programów, zwłaszcza tych, które często się odwołują do pamięci RAM.
Poza tym wbudowany w Core i7 kontroler nie obsługuje pamięci DDR2, ale szybsze pamięci DDR3 (moduły DDR3 800, 1066 i 1333 MHz). Co ważne, może pracować w sposób trzykanałowy – tzn. jeśli zastosujemy trzy moduły pamięci DDR3, wszystkie dane będą zapisywane i pobierane znacznie szybciej, bo przez trzy kanały jednocześnie.
Poprawa wydajności podsystemu pamięci procesorów Core i7 związana jest także z zastosowaniem aż 8-megabajtowej pamięci podręcznej trzeciego poziomu cache L3. Ta pamięć, w odróżnieniu od cache L2, przydzielonej na wyłączność do każdego z czterech rdzeni procesora (po 256 KB dla każdego), jest wspólna dla wszystkich czterech rdzeni. Dane z pamięci RAM są pobierane z wyprzedzeniem do pamięci cache L3 i stamtąd trafiają do pamięci cache L2.
Z kolei zastąpienie przestarzałej magistrali systemowej FSB nową, o nazwie QuickPath Interconnect QPI, pozwala na przyspieszenie wymiany danych między procesorem a resztą komputera – w tym kartami graficznymi. Prędkość transmisji na magistrali QPI dochodzi do 25,6 GB/s przy zastosowaniu standardowych czterech linii QPI o przepływności 6,4 GB/s każda. W nowych modelach procesorów liczba linii może być zwiększona lub zmniejszona w zależności od potrzeb i zastosowań układu. Producent twierdzi, że QPI zapewnia ponaddwukrotny wzrost wydajności transmisji danych między układami w stosunku do wieloprocesorowych systemów komputerowych korzystających z magistrali FSB.
Multimedia i wielowątkowość
Zwiększyły się multimedialne możliwości procesora Core i7. Rozszerzona lista rozkazów multimedialnych SSE w obecnej wersji 4.2 przede wszystkim usprawnia przetwarzanie i odtwarzanie materiałów wideo w wysokiej rozdzielczości HD.
Powrócono też do technologii HyperThreading, z której Intel zrezygnował w układach poprzedniej generacji. Dzięki niej procesory Intel Core i7 mogą przetwarzać równolegle aż osiem wątków programu lub wykonywać jednocześnie osiem jednowątkowych programów. W praktyce oznacza to, że żadna działająca w tle aplikacja nie spowolni wykonywania głównego programu, np. działający w tle skaner antywirusowy nie zakłóci rozgrywki w grze.
Ponadto układy Core i7 wykorzystują technologię Turbo Boost, która pozwala sterować napięciem i prędkością zegara dla poszczególnych rdzeni. Zatem każdy z rdzeni może być niezależnie spowalniany lub wyłączany w chwili, gdy nie jest mocno obciążony lub podczas bezczynności. Tak się dzieje w przypadku uruchomienia wielu aplikacji jednowątkowych, np. większości gier, które są wykonywane na jednym rdzeniu.
Co ważne, w chwili wyłączenia któregoś z rdzeni automatycznie zwiększa się prędkość zegara taktującego pozostałe rdzenie. Zadania jednowątkowe są szybciej przetwarzane przy tym samym poborze energii i bez zwiększania wydzielanego przez procesor ciepła.
Wbudowana grafika
Procesory Intel Core i7 są zaprojektowane modułowo. W zależności od potrzeb producent może wytwarzać modele układów, w których zwiększono lub zmniejszono liczbę rdzeni, zmieniono typ kontrolera pamięci, liczbę łączy magistrali QPI czy wielkość pamięci cache. Przewidziano też układy Core i7 z modułem graficznym (pojawią się najwcześniej pod koniec 2009 roku). Moduł ma być sprzętowo zgodny z bibliotekami graficznymi OpenGL 2.0 i Microsoft DirectX 10. Wbudowane weń dekodery pozwolą odciążyć procesor od pracochłonnego wykonywania operacji związanych z dekodowaniem materiałów wideo zapisanych zarówno w zwykłej rozdzielczości, jak i w jakości HD.
Struktura procesorów Intel Core i7 oraz AMD Phenom II – zbliżone koncepcje
Najnowsze procesory Intela i AMD mają zbliżoną architekturę. Zawierają po cztery rdzenie (1), mają zintegrowany kontroler pamięci (2) (Intel dopiero wprowadził takie rozwiązanie, AMD stosuje je od lat) i wykorzystują dużą pamięć podręczną trzeciego poziomu cache L3 (3). Pamięć ta jest zorganizowana w blokach 4x2 MB w Core i7 oraz 2x3 MB w Phenom II, ale jest współdzielona przez wszystkie rdzenie. Oba procesory są wytwarzane w nowoczesnej technologii 45 nm, przy czym dla Intela to kolejny model produkowany w takim procesie, a AMD stawia na tym polu pierwsze kroki.
AMD Phenom II – zgodny z poprzednikami
Procesor Phenom II w obecnych wersjach można umieścić w starszych płytach. Współpracują one z pamięciami RAM typu DDR2. Natomiast kolejne układy z serii, wyposażone w nowe gniazdko, będą obsługiwać pamięci DDR3.
Zmiany w pamięci
W procesorach AMD Phenom II najbardziej podkreślaną zmianą, obok przejścia na niższy proces technologiczny, jest wprowadzenie 6 MB pamięci podręcznej trzeciego poziomu, trzy razy większej niż w poprzedniej serii phenomów. Jak twierdzi producent, spowoduje to jednak 5-procentowy wzrost wydajności w porównaniu z poprzednikami taktowanymi zegarem o tej samej częstotliwości. Zysk ten będzie widoczny np. w grach, przy konwersji materiału wideo. Ale niektóre aplikacje nie wykażą przyspieszenia.
Wynika to m.in. stąd, że zintegrowany z CPU kontroler pamięci występował już w poprzednich phenomach, więc nie ma spektakularnego wzrostu wydajności widocznego przy przeniesieniu kontrolera z płyty głównej do procesora. Poza tym kontroler zastosowany w dostępnych modelach Phenom II jest przystosowany do współpracy z pamięcią DDR2. Dopiero zapowiadany na pierwszą połowę tego roku model Phenom II X4 945 będzie wyposażony w kontroler obsługujący szybsze pamięci DDR3. Ma on umożliwiać korzystanie z pamięci z użyciem dwóch kanałów. Kanały te będą mogły pracować niezależnie, tzn. jeden może odczytywać dane dla jednej aplikacji, a drugi zapisywać dane dla innej aplikacji. W efekcie nowy kontroler pamięci, korzystając z modułów DDR3, ma zapewnić wydajniejsze o kolejne 5 proc. działanie komputera.
Szybsza magistrala
QPI to intelowski odpowiednik obecnej na rynku od 6 lat magistrali HyperTransport. W procesorach Phenom II pojawiła się jej trzecia wersja. Umożliwia ona stosowanie zewnętrznych układów połączonych bezpośrednio z procesorem i wspomagających wykonywanie przez procesor określonych zadań.
Wzrosła też częstotliwość taktowania magistrali do 2,6 GHz z 1,4 GHz. Dzięki temu będzie ona oferowała większą przepustowość niż wcześniejsza HyperTransport 2.0 – 41,6 GB/s zamiast 22,4 GB/s.
Kompatybilne gniazdka
Pierwsze procesory Phenom II korzystają z obecnie stosowanych gniazdek AM2+. Również kolejne modele ze złączem AM3 będą zgodne z AM2+, co oznacza, że będzie można je montować zarówno w starszych płytach, jak i dopiero pojawiających się płytach z gniazdem AM3. Ale uwaga, by móc używać pamięci DDR3, potrzebny już będzie procesor i płyta ze złączem AM3.
Możliwość zastosowania Phenoma II w tych samych płytach, które obsługują pierwszą generację procesorów Phenom, pozwoli posiadaczom starszych komputerów wymienić wolniejszy układ na szybszy i zużywający mniej energii. Będą musieli co najwyżej uaktualnić BIOS płyty głównej do nowej jego wersji. AMD zapowiada, że być może na początku 2010 r. wprowadzi szybsze procesory AMD, w tym 6-rdzeniowe. Będzie można je stosować w podstawkach AM2+ i AM3.
Popus – tani Phenom II
AMD przygotowuje również uboższe modele phenomów II, kodowo nazywane Popus. Będą pozbawione pamięci podręcznej trzeciego poziomu, co pozwoli zmniejszyć powierzchnię zajmowaną przez pojedynczy procesor na waflu krzemowym z 261 do około 140 mm^^2. Te procesory mogą być o blisko połowę tańsze, a jednocześnie tylko o ok. 15 proc. wolniejsze od phenomów II wyposażonych w cache L3. Ich zaletą będzie też bardziej ograniczone zużycie energii. Współczynnik TDP, określający, ile ciepła musi odebrać układ chłodzący od procesora, dla modelu Phenom II X4 940 wynosi 125 W, dla procesorów z rodziny Popus będzie ograniczony nawet do 65 W. Zapewne pojawią się również wersje mniej podatne na podkręcanie, ale z TDP obniżonym do 35–45 W. To pozwoli na stosowanie ich w najwydajniejszych notebookach, w których obecnie dominują układy Intela.
W planach są też procesory dwurdzeniowe, wykonane w procesie 45 nm i wykorzystujące rozwiązania układów Phenom II, ale nie tak złożone.
Platforma Dragon
Przy okazji premiery procesorów Phenom II firma AMD zaprezentowała platformę Dragon. Jej elementami są procesory Phenom II, karty graficzne Radeon HD 48x0 oraz chipsety z serii 7xx. Ewenementem jest, że wszystkie te elementy, kluczowe dla wydajności komputera, mają tego samego producenta. AMD rozwija również oprogramowanie, które pozwoli na zwiększenie wydajności tych komponentów. AMD OverDrive 3.0 zapewni maksymalne podkręcanie procesora, pamięci oraz chipsetu. Z kolei ATI FireStream ma umożliwić przeniesienie obliczeń graficznych z procesora na kartę graficzną, np. przy konwersji plików wideo rozwiązanie to okazuje się nawet 20-krotnie wydajniejsze niż pozostawienie przetwarzania procesorowi głównemu.
Z czasem chipsety 7xx zostaną zastąpione przez układy serii 8xx. Zostaną w nich zintegrowane układy sieciowe, co pozwoli obniżyć ceny płyt głównych i zwiększyć wydajność połączeń sieciowych. Pojawią się też kolejne stany oszczędzania energii, umożliwiające dodatkowe zmniejszenie poboru prądu przez cały komputer.
Nowe procesory w akcji – redakcyjne testy
Mamy już za sobą pierwsze testy nowych układów AMD i Intela. W naszym laboratorium sprawdziliśmy zarówno najwydajniejszego Phenoma II X4 940, jak i jego intelowski odpowiednik (pod względem ceny) model Core i7 920. Kosztują one średnio około 1100 złotych.
Efekt zmian w AMD
W procesorze AMD Phenom II pojawiło się kilka zmian konstrukcyjnych, które pozwalają zwiększyć wydajność w stosunku do wcześniejszego Phenoma. Dzięki zmniejszeniu procesu produkcyjnego układy mogą pracować z wyższą częstotliwością przy zachowaniu umiarkowanej wartości poboru mocy. Wzrost zegara daje przyrost wydajności we wszystkich aplikacjach, dlatego Phenom II 940 (3 GHz) jest przynajmniej o kilkanaście procent szybszy od najszybszego sprzedawanego dotychczas Phenoma X4 9950 (2,6 GHz).
Kolejna zmiana to wzrost pojemności pamięci cache L3, który w niektórych aplikacjach nie daje żadnej poprawy wydajności, w innych pozwala na nawet dwukrotne przyspieszenie obliczeń. Dobrym przykładem jest szybki kodek MP3 GOGO-no-coda, a także test Scimark2, przeprowadzany w środowisku Javy i testujący wydajność w złożonych obliczeniach matematycznych. Oba te programy podczas testów działały na Phenomie II ponad dwukrotnie szybciej niż na poprzednim układzie. Ogólnie w naszych testach Phenom II X4 940 jest o 1/3 szybszy niż Phenom X4 9950. To duży skok wydajności, ale… nie tak duży jak w przypadku procesorów konkurencyjnych.
Efekt zmian w Intelu
Architektura procesorów Intel Core i7 zmieniła się tak bardzo, że trudno przewidzieć ich reakcje w poszczególnych aplikacjach. Pojawienie się pamięci cache L3 może bardzo przyspieszyć działanie tylko niektórych programów, ale już wydzielenie magistrali pamięci z pewnością odciąży główną magistralę systemową. Należy jednak pamiętać, że kontroler obsługuje pamięć DDR3, która z reguły ma większe opóźnienia (w cyklach) w dostępie do danych niż DDR2, więc procesor dłużej czeka na ich pobranie z pamięci. Technologia HyperThreading umożliwia jednoczesne wykonywanie dodatkowych wątków, ale niewiele programów z tego skorzysta (na razie większość efektywnie wykorzystuje najwyżej układy dwurdzeniowe).
Core i7 920 zyskuje ogólnie 23 procent wydajności w stosunku do Core 2 Quad Q9400 o tym samym zegarze. Zaobserwowaliśmy wyniki rewelacyjne, np. w teście WinRAR bardzo zależnym od wydajności pamięci, przyrost o ponad 100 procent, a przy kompresji MPEG‑2 wydajność o ponad połowę lepszą niż Q9400. W kilku aplikacjach, np. kompresji kodekiem H.264, procesor był jednak słabszy od poprzednika.
AMD kontra Intel
Z testów wynika, że układ Core i7 920 jest o około 10 procent szybszy niż Phenom II X4 940. Największa przewaga dotyczy renderowania scen w programie do grafiki 3D Blender – Intel jest nawet o połowę szybszy od AMD. W poprzednich układach Intela ograniczeniem była szyna FSB, co było szczególnie widać w Blenderze.
Znaczną przewagę układu Intela widać również w przetwarzaniu grafiki płaskiej w benchmarku Paint.NET (jest szybszy od AMD o 50 proc.), renderowaniu sceny 3D w Cinebench 10 (o 35 proc.), konwersji do formatu JPG w aplikacji Lightroom (o 30 proc.), konwersji XviD (prawie 30 proc.). Tylko w nielicznych zastosowaniach wydajniejszy okazuje się Phenom II – w programie 7zip (wypada o 33 proc. lepiej) czy kompresji kodekiem H.264 (do 30 proc. lepiej).
Warunki testu
Porównując procesory AMD Phenom II X4 940 i Intel Core i7 920, pamiętajmy o kilku szczegółach. Są to układy, które kosztują prawie tyle samo, więc konfrontacja ich wydajności jest uzasadniona. Z drugiej strony jednak porównujemy najtańszy procesor Core i7 z najdroższym Phenomem II – pierwsza rodzina układów zapewnia jeszcze większą wydajność (modele 940, 965), w przypadku Phenomów to na razie koniec możliwości. Oczywiście inaczej mogą się zachowywać układy Phenom II w podstawkach AM3, które mają się pojawić w tej połowie roku. Jest jeszcze jeden ważny szczegół – nasze testy są przeprowadzane w najpopularniejszych obecnie systemach 32-bitowych. W systemach 64-bitowych wydajność będzie zdecydowanie lepsza, i to zarówno procesorów AMD, jak i Intela.