Co za kRAM!

Kupując komputer, najwięcej wagi przywiązujemy zazwyczaj do wyboru procesora i karty graficznej, bo one są najistotniejsze w kontekście wydajności. Nie pamiętamy jednak o tym, że niekoniecznie warto dopłacać do wyższego modelu CPU, bo ten sam lub lepszy efekt osiągniemy, płacąc za szybszy RAM.

Nierzadko cały namysł nad pamięcią operacyjną nowego peceta sprowadza się do ustalenia jej wielkości. Nie ma w tym nic dziwnego, bo to przecież najważniejszy parametr, ale znajomość innych cech RAM-u pozwoli na lepszy wybór. Ponieważ ta wiedza wydaje się niezbyt rozpowszechniona, postanowiliśmy zebrać informacje przydatne i w czasie zakupów, i przy zwiększeniu wydajności już posiadanej maszyny – nasze porady wsparliśmy testem praktycznym, ilustrującym poruszane w artykule zagadnienia.

Wspomniane kryterium pojemności ogranicza się właściwie do stwierdzenia: 4 GB to dziś absolutne minimum (część gier się nie uruchomi), 8 GB jest przyzwoitym standardem, a 16 GB pozwala nie przejmować się apetytem aplikacji i gier na RAM. Nie zapominajmy też, że pamięć to najłatwiejsza rzecz do rozbudowy i przeważnie wymaga jedynie dokupienia kolejnych modułów (wyjątek stanowią płyty główne wyposażone w dwa gniazda i w pełni obsadzone – w takiej sytuacji konieczna jest wymiana). Tym bardziej więc w sytuacji nieco bardziej napiętego budżetu lepiej na początek kupić mniej pojemne, ale za to lepsze pamięci DDR4. W tym miejscu ważna jest następująca uwaga: jeśli planujemy podkręcanie, wybierajmy modele z radiatorami, bo wbrew pozorom pamięć także potrafi się mocno nagrzać. Z drugiej strony nie ma też co przepłacać, jeśli ogranicza nas np. chipset (o tym w dalszej części artykułu).

Na wzmiankę zasługują procesory z wbudowaną kartą graficzną, gdyż w takiej konfiguracji w związku z brakiem przeznaczonej do tego celu pamięci układy te korzystają z RAM-u. W takiej sytuacji przepustowość ma większe znaczenie, gdyż szybsze moduły wyraźnie poprawią możliwości tych GPU, których wydajność wystarcza do gier e-sportowych – chodzi tu o procesory z wbudowaną kartą Radeon Vega (w przypadku CPU Intela ma to marginalny oddźwięk).

CL – jak spóźniać się mniej

Zacznijmy od nazewnictwa – bo choć spójne, to może być mylące – i paru prostych, acz przydatnych działań arytmetycznych. Jako przykład posłużą nam oznaczenia pamięci użytych w teście. Są to moduły firmy Patriot z rodziny Viper Steel w wersji 2x8 GB i 2x16 GB. Te pierwsze mają na pudełku napis PC4-35200 4400 Hz, który de facto jest zdublowaniem – acz przydatnym – tej samej informacji. Otóż pierwszy człon nazwy informuje nas o teoretycznej maksymalnej przepustowości wyrażonej w megabajtach na sekundę (tu 35 200 MB/s), a drugi o liczbie transferów w ciągu sekundy. Nie jest to rzeczywista częstotliwość pracy – choć dla uproszczenia tak się mówi – gdyż pamięci DDR w każdym cyklu zegara dokonują dwóch transferów (to właśnie oznacza skrót DDR: Double Data Rate), więc faktyczne taktowanie wynosi 2200 MHz (świetnie to pokazują programy diagnostyczne, np. CPU-Z w polu DRAM Frequency podaje odczyt realnego taktowania).

Magistrala pamięci ma szerokość 64 bitów, czyli 8 bajtów. Policzmy więc: 8 bajtów x 2200 MHz (takie jest taktowanie) x 2 (w każdym cyklu dwa transfery) = 35 200 megabajtów na sekundę. Proste, nieprawdaż? Drugą metodą informowania o szybkości pamięci jest zapis DDR4-4400 (bez żadnych jednostek), więc z tego zapisu wnosimy, że częstotliwość taktowania wynosi połowę liczby stojącej za myślnikiem – w tym przypadku jest to 2200 MHz.

Skomplikujmy więc nieco te rachunki, pytając o to, ile wynosi opóźnienie CL wyrażone w nanosekundach (patrz ramka Bajka o CL, czyli skąd się biorą opóźnienia). W tym celu musimy znać wartość timingów – dla testowanego zestawu 2x8 GB wynoszą one to 19-19-19-39 przy DDR4-4266. Najpierw więc ustalamy, ile czasu zajmuje jeden cykl zegarowy, a następnie mnożymy go przez wartość parametru CL. Dzielimy więc sekundę na 2133 MHz – co daje 0,468 ns – a następnie mnożymy przez 19. Wynik to 8,9 ns. Ten wzór można zapisać jako ułamek, który w liczniku ma iloczyn 2 * 1000 * CL, a w mianowniku liczbę stojącą po myślniku w określeniu DDR4. W naszym przykładzie opóźnienie wyniesie: 2 * 1000 * CL / 4266. Osoby czujące wstręt do mnożenia mogą spojrzeć na dość bogate zestawienie obliczonych już parametrów w Wikipedii ( www.pcformat.pl/u/3562) lub skorzystać z kalkulatora online: https://notkyon.moe/ram- latency.htm.

Obliczona w ten sposób wartość służy do określenia, którymi ustawieniami warto się interesować, a które raczej nie wpłyną pozytywnie na wydajność. Jeśli więc mamy DDR4-3200 przy CL 14 i DDR4-3600 przy CL 16, to teoretycznie są to ustawienia bardzo sobie bliskie.

Jakie szanse na sukces

Nie tylko jednak parametr CL i pozostałe timingi wpływają na efekt końcowy, ale także sposób działania kontrolera pamięci (jest w procesorze), metoda uzyskania częstotliwości zegara taktującego z częstotliwości bazowej magistrali procesora, typ chipsetu płyty głównej, napięcia zasilające i typ pracy (jeśli nie jest to platforma HEDT, to jest on jedno- lub dwukanałowy). Prawda jest taka, że podnoszenie wydajności RAM-u wymaga dwóch rzeczy: cierpliwości i czasu. Skoro jednak – jak głosi dowcip – sinus w warunkach bojowych przyjmuje wartości większe od jedności, to i my możemy się pokusić o pokonanie pozornie niemożliwego.

Część chipsetów odcina nam drogę do jakiegokolwiek podkręcania częstotliwości i co najwyżej mamy wpływ jedynie na timingi. Pamiętajmy poza tym, że aktualne platformy tak AMD, jak i Intela oficjalnie obsługują jedynie pamięci DDR4-2666, a wszystko, co jest taktowane wyżej, uznaje się za podkręcanie, czyli tak czy siak robimy to na własne ryzyko. Producenci płyt głównych publikują tzw. QVL (Qualified Vendor List), czyli wykaz przetestowanych modułów, których działanie gwarantują. Oczywiście nie oznacza to, że inne kości nie będą pracowały poprawnie, ale jakiś cień ryzyka pozostaje. W gorszej sytuacji są właściciele komputerów z procesorami AMD, gdyż Ryzeny okazały się bardziej wybredne i trzeba się upewniać, czy po pierwsze dany RAM nadaje się do instalacji w maszynie z gniazdem AM4, a po drugie, jeśli pierwszy warunek jest spełniony, czy dadzą się podkręcać. Największe szanse mamy wtedy, gdy pamięć jest zbudowana na bazie układów Samsunga tzw. B-die.

I choć w naszym teście dysponowaliśmy odpowiednimi modułami, to otrzymaliśmy też jasny dowód na to, że przy założonych timingach dwie najwyższe częstotliwości nie były w żaden sposób osiągalne (a dokładniej nam się nie udało tego zrobić, być może jakieś jeszcze dłuższe manipulacje skończyłyby się sukcesem). Procesor Intela w parze z chipsetem Z390 poradził sobie gładko.

Wolty w górę

Zwiększanie wydajności można zacząć na dwa sposoby. Albo próbujemy – nie zmieniając niczego więcej – podbić taktowanie pamięci, albo zmniejszamy timingi przy tej samej częstotliwości. Tym sposobem krok po kroku jesteśmy w stanie znaleźć takie wartości timingów i zegarów, które będą stabilne. Jeśli zmiana w kolejnym kroku kończy się niepowodzeniem, to próbujemy podnieść napięcia zasilające RAM. Chodzi tu przede wszystkim o główne napięcie o standardowej dla DDR4 wartości 1,2 V. Bardzo dużo modułów z definicji ma określone, że dla profili XMP akceptowana jest wartość 1,35 V (a czasem nawet wyższa). Jeśli kupujemy RAM, to w miarę możliwości wybierajmy taki, którego producent wprost zezwala na takie podbicie woltażu. Niekiedy warto też podnieść napięcia okołoprocesorowe, ale brak nam tu miejsca na dokładniejsze rozważania.

Gdy system się uruchamia, to trzeba przeprowadzić test wydajności, a potem stabilności (patrz ramka Programy narzędziowe i diagnostyczne). Jeśli próby zakończą się sukcesem, możemy powtórzyć cykl poszukiwań innych stabilnych, ale wydajniejszych ustawień. Życzymy więc cierpliwości i dostatecznie dużo wolnego czasu!

Pecetowi moduł dano

Właśnie, gdy w komputerze gości pojedynczy moduł pamięci, to oczywiste jest, że przepustowość takiego RAM-u będzie niższa niż gdybyśmy obsadzili dwa gniazda z różnych kanałów kośćmi o sumarycznym takim samym rozmiarze. Proponujemy rzut oka na tabelę na następnych stronach i odszukanie kolumn z nagłówkiem 1x16 GB i timingiem CL 18. Dla Intela testy w programach 7-Zip i HandBrake oraz w grach World of Tanks enCore i Counter-Strike: Global Offensive wypadają lepiej niż przy parzystej obsadzie, ale w pozostałych sprawdzianach wyraźnie odstają, podczas gdy moduły dwukanałowe notują wzrosty wszędzie. W przypadku platformy AMD przewaga pojawia się punktowo. Jest więc jasne, że ta skórka raczej nie jest warta wyprawki i pojedynczy moduł możemy kupić tylko wtedy, gdy planujemy RAM rozbudować. Dla pełnej jasności: punktem odniesienia dla wszystkich wartości procentowych są rezultaty osiągnięte w konfiguracji 2x8 GB w najpopularniejszym taktowaniu, czyli DDR4-2666.

Wykorzystanie w testach identycznych timingów 18-18-18-36 pozwoliło na stworzenie bardziej klarownego obrazu, gdzie jedyną zmienną jest częstotliwość pracy. Widać, jak wraz ze wzrostem częstotliwości rośnie również przepustowość – tu nie mogło być inaczej – ale niekoniecznie przekłada się to na wyniki praktyczne, np. Blender praktycznie nie zależy od pamięci – tu decyduje moc obliczeniowa procesora, a te różnice wiążą się po prostu z niedokładnością pomiarów. Dysproporcje zarysowały się w 7-Zipie i HandBrake’u, ale nie jest to różnica oszałamiająca. Za to wyraźnie wraz z wyższym taktowaniem gry zyskiwały klatki na sekundę. I to bardzo dobra wiadomość, bowiem niekoniecznie trzeba szukać wydajniejszej karty graficznej czy wykładać pieniądze na szybszy (lub podatny na przetaktowanie) procesor. Zamiast tego może lepiej dołożyć kilkadziesiąt, sto czy nawet dwieście złotych do lepszych pamięci i osiągnąć ten sam efekt. Jeśli dodamy do tego manipulację timingami, to jesteśmy w stanie osiągnąć zauważalny wzrost wydajności. Dla porównania w tabeli są też wyniki testów dla DDR4-2666, ale ze znacznie lepszymi timingami: trzy razy CL 12 i raz CL 14. W trybie dwukanałowym różnice są warte zachodu. Zachęcamy więc do namysłu przy kupowaniu nowego peceta i namawiamy do spróbowania wyciśnięcia z obecnego komputera jeszcze nieco więcej.

Procedura testowa

Nasz test nie jest typowym sprawdzianem, w którym przyznajemy oceny i szeregujemy według nich produkty. Wykorzystane aplikacje i gry posłużyły do uzyskania informacji o różnicach w wydajności pamięci w zależności od częstotliwości pracy (2133, 2400, 2666, 2933, 3200, 3466, 3733 i 4000 MHz) oraz trybu jedno- lub dwukanałowego (1x16 GB lub 2x8 GB) przy zachowaniu zawsze takich samych timingów 18-18-18-36. Przy tych założeniach komputera z procesorem AMD nie udało się uruchomić przy taktowaniu 3733 i 4000 MHz, dlatego też tabela z wynikami jest skromniejsza w porównaniu z rezultatami uzyskanymi na platformie Intela. Celem porównania dołączyliśmy również testy przy częstotliwości 2666 MHz z timingami zbliżonymi do tych, które zostałyby użyte w rzeczywistości: 12-12-12-28 (2x8 GB Intel i AMD oraz 1x16 GB Intel) i 14-14-14-28 (AMD 1x16 GB). Całość prób przeprowadziliśmy obsadzając 16 GB pamięci wykorzystując dwa zestawy modułów Patriot Viper Steel Series DDR4. Dla konfiguracji dwukanałowej był to komplet 16 GB (2x8 GB) 4400 MHz, a przy jednokanałowej jeden moduł z zestawu 32 GB (2x16 GB) 3200 MHz. Oprócz tego wymuszaliśmy stałe napięcie zasilające RAM: zawsze było ustawione na 1,35 V.

W skład pakietu testowego wchodziły cztery aplikacje: SiSoftware Sandra (przepustowość w GB/s), 7-Zip (wydajność wyrażona w MIPS-ach), Blender (czas renderowania sceny) i HandBrake (wydajność kodowania do pliku MP4 w klatkach na sekundę). Uwzględniliśmy też pięć gier, przy czym w czterech użyliśmy wbudowanych benchmarków (Assassin’s Creed Odyssey, Shadow of the Tomb Raider, World of Tanks enCore, Counter-Strike: Global Offensive), a Wiedźminie 3: Krew i wino posłużyliśmy się zapisaną lokacją w Novigradzie. Wszystkie testy zostały wykonane w rozdzielczości Full HD przy maksymalnych ustawieniach jakości grafiki.

Czekając na DDR5

W lutym 2019 roku organizacja JEDEC (Joint Electron Device Engineering Council), która jest odpowiedzialna za standaryzację w dziedzinie mikroelektroniki – w tym przede wszystkim elementów półprzewodnikowych – zatwierdziła standard pamięci DDR5. Podstawowy zysk z wdrożenia nowej technologii to zwiększenie pojemności dzięki wykorzystaniu w budowie tzw. stosów. Kolejne wcielenie układów RAM cechuje zmniejszony pobór mocy względem najpopularniejszej obecnie odmiany DDR4, obniżono bowiem standardowe napięcie zasilające z 1,2 V do 1,1 V. Zmieni się też wydajność pamięci: już w tej chwili są moduły wyprodukowane przez SK Hynix, które przy standardowej szerokości szyny danych (64 bity) i pracy jednokanałowej osiągają przepustowość 41,6 GB/s dla taktowania 5200 MHz. Po planowanym przygotowaniu kości działających ze zwiększoną częstotliwością zegara – mówi się, że będzie to 6400 MHz – pozwoli to na podbicie tej wartości powyżej 100 GB/s przy pracy dwukanałowej. Ma to znaczenie nie tylko w zastosowaniach, gdzie operuje się dużymi ilościami danych, ale również w przypadku zintegrowanych kart graficznych, które nie mają własnej pamięci i korzystają z RAM-u komputera.

Bajka o CL, czyli skąd się biorą opóźnienia

Na całkowitą szybkość działania pamięci mają wpływ przede wszystkim dwa czynniki: taktowanie i opóźnienia. Ta druga cecha jest związana z budową RAM-u, ale nie dotyczy bezpośrednio samych komórek przechowujących bit, ale wewnętrznej organizacji modułu. Można posłużyć się analogią drzewa: do każdego liścia – jeśli poruszamy się wyłącznie po gałęziach – najkrótsza droga jest tylko jedna, ale nie można jej pokonać w jednym kroku, gdyż na każdym rozwidleniu potrzebny jest czas na decyzję, który sumarycznie wnosi jakieś opóźnienie.

Podobnie jest w module DDR4 – nie da się w jednym takcie dojść do celu. Oczywiście pamięć RAM jest zbudowana inaczej, bowiem pojedynczy układ scalony składa się z tzw. banków, z których każdy jest matrycą komórek pamięci adresowanych przez podanie kolumny i rzędu. Wymusza to stosowanie odpowiednich interwałów, które znamy jako timingi – w przypadku użytych w teście modułów 2x8 GB przeczytamy w dokumentacji, że PC4-34100 (4266 MHz) zostały przetestowane przy wartościach 19-19-19-39, a liczby te oznaczają po prostu to, ile cykli zegarowych potrzeba na poszczególne fazy pracy. Standardowe wartości dla poszczególnych częstotliwości producent zapisuje w układzie SPD (Serial Presence Detect), który może mieć także dane na potrzeby przetaktowania (tryb XMP/AMP).

1. CL (CAS Latency, czyli Column Address Select Latency) to pierwszy i najbardziej wpływający na wydajność parametr. Informuje on o tym, ile cykli musi upłynąć, żeby odczytać pierwszy bit ze wskazanej kolumny, o ile tylko został już wybrany wiersz.

2. tRCD (RAS to CAS Delay, gdzie RAS to Row Address Select) – czas między wskazaniem adresu wiersza a wskazaniem adresu kolumny.

3. tRP (Row Precharge) – czas konieczny na odświeżanie pamięci (wynika to z konieczności podtrzymywania ładunku w komórkach RAM-u) i jednocześnie na wybór kolejnego wiersza.

4. tRAS (Row Address Select) – czas konieczny do aktywacji kolejnego banku – drugi pod względem ważności parametr wpływu na całkowity czas operacji na pamięci.

Programy narzędziowe i diagnostyczne

CPU-Z (aplikacja zbierająca informacje)
www.cpuid.com

HWiNFO64 (aplikacja zbierająca informacje)
www.hwinfo.com

Taiphoon Burner (aplikacja zbierająca dane i umożliwiająca zaawansowaną modyfikację parametrów modułu SPD)
www.softnology.biz

DRAM Calculator for Ryzen (aplikacja do wyliczania parametrów pracy pamięci; obsługa jest niełatwa, więc warto skorzystać z menu Help i wybrać English support, a następnie obejrzeć wideo z instruktażem)
www.pcformat.pl/u/3560

Kalkulator opóźnień
www.notkyon.moe/ram-latency.htm

MemTest86+ (diagnostyka pamięci)
www.memtest.org

TechPowerUp MemTest64 (do szybkiego sprawdzenia stabilności pamięci po overclockingu)
www.techpowerup.com/memtest64

Intel Memory Latency Checker (aplikacja do sprawdzania opóźnień i przepustowości)
www.pcformat.pl/u/3561

7-Benchmark (aplikacja testująca m.in. opóźnienia i przepustowość)
www.7-cpu.com/utils.html

Diagnostyka pamięci systemu Windows (narzędzie wbudowane w system, należy kliknąć menu Start i wpisać słowo „diagnostyka”)