Konfiguracja sprzętu i oprogramowania

Czy potrzebuję pamięci podręcznej poziomu 3 do gier? Małe porównanie pamięci podręcznej L3 w grach i aplikacjach

Pamięć podręczna - bufor pośredni z szybki dostęp A, który zawiera informacje, które najprawdopodobniej będą wymagane. Dostęp do danych w pamięci podręcznej jest szybszy niż pobieranie danych początkowych z operacyjnej (RAM) i szybszy niż zewnętrzny ( dysk twardy lub dysk SSD) pamięć, która skraca średni czas dostępu i zwiększa Całkowita wydajność system komputerowy.

Wiele modeli jednostek centralnych (CPU) ma własną pamięć podręczną, aby zminimalizować dostęp do pamięć o dostępie swobodnym(RAM), który jest wolniejszy niż rejestry. Pamięć podręczna może zapewnić znaczny wzrost wydajności, gdy taktowanie pamięci RAM jest znacznie niższe niż częstotliwość taktowania procesora. Szybkość zegara pamięci podręcznej jest zwykle niewiele mniejsza niż częstotliwość procesora.

Poziomy pamięci podręcznej

Pamięć podręczna procesor podzielone na kilka poziomów. W procesorze ogólnego przeznaczenia liczba poziomów może obecnie wynosić nawet 3. Pamięć podręczna poziomu N+1 jest zwykle większa i wolniejsza w dostępie i przesyłaniu danych niż pamięci podręczne poziomu N.

bardzo szybka pamięć to pamięć podręczna pierwszego poziomu — pamięć podręczna L1. W rzeczywistości jest integralną częścią procesora, ponieważ znajduje się na tym samym chipie i jest częścią bloków funkcjonalnych. W nowoczesnych procesorach pamięć podręczna L1 jest zwykle podzielona na dwie pamięci podręczne, pamięć podręczną instrukcji (instrukcji) i pamięć podręczną danych (architektura Harvarda). Większość procesorów bez pamięci podręcznej L1 nie może działać. Pamięć podręczna L1 działa z częstotliwością procesora i ogólnie jest dostępna w każdym cyklu zegara. Często możliwe jest jednoczesne wykonywanie wielu operacji odczytu/zapisu. Opóźnienie dostępu wynosi zwykle 2-4 cykle rdzenia. Objętość jest zwykle niewielka - nie więcej niż 384 KB.

Drugim najszybszym jest pamięć podręczna L2 - pamięć podręczna drugiego poziomu, zwykle znajduje się na chipie, takim jak L1. W starszych procesorach włączony chipset płyta główna. Objętość pamięci podręcznej L2 wynosi od 128 KB do 1x12 MB. W nowoczesnym procesory wielordzeniowe pamięć podręczna drugiego poziomu, znajdująca się na tym samym chipie, jest pamięcią do oddzielnego użytku - przy całkowitym rozmiarze pamięci podręcznej nM MB, każdy rdzeń ma nM / nC MB, gdzie nC to liczba rdzeni procesora. Zazwyczaj opóźnienie pamięci podręcznej L2 znajdującej się na chipie rdzenia wynosi od 8 do 20 cykli rdzenia.

Pamięć podręczna trzeciego poziomu jest najmniej szybka, ale może być bardzo imponująca pod względem wielkości - ponad 24 MB. Pamięć podręczna L3 jest wolniejsza niż poprzednie pamięci podręczne, ale nadal znacznie szybsza niż pamięć RAM. W systemach wieloprocesorowych jest powszechnie stosowany i służy do synchronizacji danych o różnych L2.

Czasami istnieje również pamięć podręczna poziomu 4, zwykle znajduje się ona w osobnym chipie. Stosowanie pamięci podręcznej poziomu 4 jest uzasadnione tylko w przypadku serwerów o wysokiej wydajności i komputerów mainframe.

Problem z synchronizacją między różne skrytki(zarówno jeden, jak i wiele procesorów) jest rozwiązywane przez spójność pamięci podręcznej. Istnieją trzy opcje wymiany informacji między pamięciami podręcznymi na różnych poziomach lub, jak mówią, architektury pamięci podręcznych: inkluzywna, wyłączna i niewyłączna.

podczas robienia różne zadania procesor komputera otrzymuje niezbędne bloki informacji z pamięci RAM. Po ich przetworzeniu CPU zapisuje wyniki obliczeń do pamięci i otrzymuje kolejne bloki danych do przetworzenia. Trwa to aż do zakończenia zadania.

Powyższe procesy realizowane są z bardzo dużą szybkością. Jednak prędkość nawet najszybszej pamięci RAM jest znacznie mniejsza niż prędkość dowolnego słabego procesora. Każda czynność, czy to zapisywanie do niej informacji, czy odczytywanie z niej, zajmuje dużo czasu. Szybkość pamięci RAM jest dziesięć razy mniejsza niż szybkość procesora.

Pomimo takiej różnicy w szybkości przetwarzania informacji, procesor komputera nie jest bezczynny i nie czeka na wydanie i odebranie danych przez pamięć RAM. Procesor cały czas działa, a wszystko dzięki obecności w nim pamięci podręcznej.

Pamięć podręczna to specjalny rodzaj pamięci RAM. Procesor wykorzystuje pamięć podręczną do przechowywania tych kopii informacji z głównej pamięci RAM komputera, które prawdopodobnie będą dostępne w najbliższej przyszłości.

Zasadniczo pamięć podręczna działa jak szybki bufor pamięci, który przechowuje informacje, których może potrzebować procesor. W ten sposób procesor otrzymuje niezbędne dane dziesięć razy szybciej niż podczas odczytywania ich z pamięci RAM.

Główną różnicą między pamięcią podręczną a zwykłym buforem są wbudowane funkcje logiczne. Bufor przechowuje losowe dane, które są zwykle przetwarzane zgodnie ze schematem „pierwszy odebrany, pierwszy wydany” lub „pierwszy odebrany, ostatni wydany”. Pamięć podręczna zawiera dane, które prawdopodobnie będą dostępne w najbliższej przyszłości. Dlatego dzięki „inteligentnej pamięci podręcznej” procesor może działać z pełną prędkością i nie czekać na pobranie danych z wolniejszej pamięci RAM.

Główne typy i poziomy pamięci podręcznej L1 L2 L3

Pamięć podręczna ma postać układów statycznej pamięci o dostępie swobodnym (SRAM), które są instalowane na płycie systemowej lub wbudowane w procesor. W porównaniu z innymi typami pamięci, pamięć statyczna może działać z bardzo dużą szybkością.

Szybkość pamięci podręcznej zależy od wielkości konkretnego chipa, im większy jest chip, tym trudniej jest osiągnąć dużą prędkość jego działania. Rozważając ta cecha, podczas produkcji pamięć podręczna procesora jest tworzona w postaci kilku małych bloków zwanych poziomami. Najpopularniejszym dzisiaj jest trzypoziomowy system pamięci podręcznej L1, L2, L3:

Pamięć podręczna pierwszego poziomu L1 - najmniejsza objętość (tylko kilkadziesiąt kilobajtów), ale najszybsza i najważniejsza. Zawiera dane najczęściej używane przez procesor i działa bez opóźnień. Zazwyczaj liczba układów pamięci L1 jest równa liczbie rdzeni procesora, przy czym każdy rdzeń ma dostęp tylko do własnego układu L1.

Pamięć podręczna L2 jest gorszy od pamięci L1, ale wygrywa pod względem objętości, która jest już mierzona w kilkuset kilobajtach. Służy do tymczasowego przechowywania. ważna informacja, prawdopodobieństwo dostępu jest niższe niż w przypadku informacji przechowywanych w pamięci podręcznej L1.

Pamięć podręczna trzeciego poziomu L3 - ma największy wolumen z trzech poziomów (może sięgać kilkudziesięciu megabajtów), ale też ma najwięcej niska prędkość, który wciąż jest znacznie wyższy niż prędkość pamięci RAM. Pamięć podręczna L3 jest współużytkowana przez wszystkie rdzenie procesora. Poziom pamięci L3 jest przeznaczony do tymczasowego przechowywania tych ważnych danych, których prawdopodobieństwo dostępu jest nieco niższe niż w przypadku informacji przechowywanych na pierwszych dwóch poziomach L1, L2. Zapewnia również interakcję rdzeni procesora ze sobą.

Niektóre modele procesorów są wykonane z dwoma poziomami pamięci podręcznej, w których L2 łączy wszystkie funkcje L2 i L3.

Gdy przydatna jest duża ilość pamięci podręcznej.

Odczujesz znaczący efekt dużej ilości pamięci podręcznej podczas korzystania z programów do archiwizacji, w grach 3D, podczas przetwarzania i kodowania wideo. W stosunkowo „lekkich” programach i aplikacjach różnica praktycznie nie jest zauważalna (programy biurowe, odtwarzacze itp.).

Dobry dzień. Dzisiaj postaramy się wyjaśnić wam coś takiego jak pamięć podręczna. Pamięć podręczna procesora to ultraszybka macierz przetwarzająca dane, która jest 16-17 razy szybsza niż standardowa pamięć RAM, jeśli chodzi o DDR4.

Z tego artykułu dowiesz się:

Jest to ilość pamięci podręcznej, która pozwala procesorowi działać z maksymalnymi prędkościami, bez czekania, aż pamięć RAM przetworzy jakiekolwiek dane i wyśle ​​wyniki zakończonych obliczeń do chipa w celu dalszego przetwarzania. Podobną zasadę można prześledzić na dysku twardym, wykorzystywany jest tam tylko bufor o wielkości 8–128 MB. Inną rzeczą jest to, że prędkości są znacznie niższe, ale proces jest podobny.

Co to jest pamięć podręczna procesora?

Jak ogólnie działa proces obliczeniowy? Wszystkie dane są przechowywane w pamięci RAM, która służy do tymczasowego przechowywania ważnych informacji o użytkowniku i systemie. Procesor sam wybiera określoną liczbę zadań, które są wprowadzane do ultraszybkiego bloku zwanego pamięcią podręczną, i zaczyna wykonywać swoje bezpośrednie obowiązki.

Wyniki obliczeń są ponownie przesyłane do pamięci RAM, ale w znacznie mniejszej ilości (zamiast tysiąca wartości wyjściowych otrzymujemy znacznie mniej), a do przetwarzania pobierana jest nowa tablica. I tak dalej, aż praca zostanie wykonana.

Szybkość pracy zależy od wydajności pamięci RAM. Ale ani jeden nowoczesny moduł DDR4, w tym rozwiązania do przetaktowywania z częstotliwościami poniżej 4000 MHz, nie zbliżył się do możliwości najbardziej zahamowanego procesora z jego „wolną” pamięcią podręczną.

Dzieje się tak, ponieważ szybkość procesora przewyższa wydajność pamięci RAM średnio 15 razy, a nawet więcej. I nie patrz tylko na parametry częstotliwości, oprócz nich jest wystarczająco dużo różnic.
Teoretycznie okazuje się, że nawet ciężkie Intel Xeon i AMD Epyc są zmuszone do bezczynności, ale w rzeczywistości oba chipy serwerowe pracują na swoim limicie. A wszystko dlatego, że zbierają wymaganą ilość danych według wielkości pamięci podręcznej (do 60 MB lub więcej) i błyskawicznie je przetwarzają. RAM służy jako rodzaj magazynu, z którego pobierane są tablice do obliczeń. Zwiększa się wydajność obliczeniowa komputera i wszyscy są zadowoleni.

Krótka wycieczka do historii

Pierwsze wzmianki o pamięci podręcznej pochodzą z końca lat 80-tych. Do tego czasu szybkość procesora i pamięci była w przybliżeniu taka sama. Szybki rozwój chipów wymagał pewnego rodzaju „podbicia”, aby zwiększyć prędkość pamięci RAM, ale użycie ultraszybkich chipów było bardzo drogie, dlatego postanowili poradzić sobie z bardziej ekonomiczną opcją - wprowadzeniem pamięci o dużej szybkości tablica w procesorze.

Pierwszy moduł pamięci podręcznej pojawił się w Intel 80386. W tym czasie opóźnienia DRAM oscylowały wokół 120 nanosekund, podczas gdy bardziej nowoczesny moduł SRAM redukował opóźnienia do imponujących 10 nanosekund. Przybliżony obraz wyraźniej ukazuje konfrontacja HDD i SSD.

Początkowo pamięć podręczna była lutowana bezpośrednio do płyty główne, ze względu na ówczesny poziom zaawansowania technicznego. Począwszy od Intel 80486, 8 kb pamięci było wbudowane bezpośrednio w kość procesora, co dodatkowo zwiększało wydajność i zmniejszało obszar matrycy.

Ta technologia układu pozostała aktualna tylko do wydania Pentium MMX, po którym pamięć SRAM została zastąpiona bardziej zaawansowaną pamięcią SDRAM.
A procesory stały się znacznie mniejsze, a zatem zniknęła potrzeba obwodów zewnętrznych.

Poziomy pamięci podręcznej

Na znakowaniu nowoczesnych procesorów oprócz i można znaleźć coś takiego jak rozmiar pamięci podręcznej na poziomie 1,2 i 3. Jak jest definiowana i na co wpływa? Zrozummy w prostych słowach.

  • Pamięć podręczna pierwszego poziomu (L1) to najważniejszy i najszybszy układ w architekturze procesora. Jeden procesor może pomieścić liczbę modułów równą liczbie rdzeni. Warto zauważyć, że mikroukład może przechowywać w pamięci najbardziej pożądane i ważne dane tylko ze swojego rdzenia. Rozmiar tablicy jest często ograniczony do 32-64 KB.
  • Pamięć podręczna drugiego poziomu (L2) - spadek prędkości rekompensowany jest zwiększeniem rozmiaru bufora, który sięga 256, a nawet 512 KB. Zasada działania jest taka sama jak w przypadku L1, ale częstotliwość żądań pamięci jest niższa, ze względu na przechowywanie w niej danych o mniejszym priorytecie.
  • Pamięć podręczna trzeciego poziomu (L3) jest najwolniejszą i najbardziej obszerną partycją spośród wszystkich wymienionych. Mimo to ta macierz jest znacznie szybsza niż pamięć RAM. Rozmiar może osiągnąć 20, a nawet 60 MB, jeśli chodzi o chipy serwerowe. Korzyść z macierzy jest ogromna: jest kluczowym ogniwem w wymianie danych między wszystkimi rdzeniami systemu. Bez L3 wszystkie elementy chipa byłyby rozproszone.

W sprzedaży można znaleźć zarówno dwu-, jak i trzypoziomową strukturę pamięci. Który jest lepszy? Jeśli używasz procesora tylko do programy biurowe i zwykłe gry, nie poczujesz żadnej różnicy. Jeśli system jest montowany z myślą o złożonych grach 3D, archiwizacji, renderowaniu i grafice, wzrost w niektórych przypadkach wyniesie od 5 do 10%.
Pamięć podręczna L3 jest uzasadniona tylko wtedy, gdy zamierzasz regularnie pracować z aplikacjami wielowątkowymi, które wymagają regularnych złożone obliczenia. Z tego powodu modele serwerów często wykorzystują duże pamięci podręczne L3. Chociaż zdarzają się sytuacje, kiedy to nie wystarczy i dlatego trzeba dodatkowo zainstalować tak zwane moduły L4, które wyglądają jak osobny mikroukład podłączony do płyty głównej.

Jak sprawdzić liczbę poziomów i rozmiar pamięci podręcznej na swoim procesorze?

Zacznijmy od tego, że można to zrobić na 3 sposoby:

  • w poprzek wiersz poleceń(tylko pamięć podręczna L2 i L3);
  • wyszukując specyfikacje w Internecie;
  • za pomocą narzędzi stron trzecich.

Jeśli za podstawę przyjmiemy fakt, że dla większości procesorów L1 wynosi 32 KB, a L2 i L3 mogą się znacznie wahać, potrzebujemy dwóch ostatnich wartości. Aby je wyszukać, otwórz wiersz poleceń za pomocą „Start” (wprowadź wartość „cmd” w pasku wyszukiwania).

System pokaże podejrzanie wysoką wartość dla L2. Musisz podzielić to przez liczbę rdzeni procesora i dowiedzieć się, jaki jest ostateczny wynik.

Jeśli zamierzasz szukać danych w sieci, najpierw znajdź dokładną nazwę procesora. Kliknij kliknij prawym przyciskiem myszy na ikonie „Mój komputer” i wybierz „Właściwości”. W kolumnie „System” pojawi się pozycja „Procesor”, której faktycznie potrzebujemy. Przepisz jego nazwę w tym samym Google lub Yandex i zobacz wartość na stronach. Aby uzyskać wiarygodne informacje, lepiej wybrać oficjalne portale producenta (Intel lub AMD).
Trzecia metoda również nie sprawia problemów, ale wymaga instalacji dodatkowego oprogramowania, takiego jak GPU-Z, AIDA64 i innych narzędzi do badania specyfikacji kamienia. Opcja dla fanów overclockingu i roju w detalach.

Wyniki

Teraz rozumiesz, czym jest pamięć podręczna, od czego zależy jej rozmiar i do jakich celów używana jest ultraszybka macierz danych. Na ten moment Najciekawszymi rozwiązaniami na rynku pod względem dużej pamięci podręcznej są urządzenia AMD Ryzen 5 i 7 z ich 16 MB L3.

W kolejnych artykułach omówimy takie tematy, jak procesory, zalety chipów i nie tylko. i zostań z nami. Do następnego spotkania, pa.

Witamy na GECID.com! Nie od dziś wiadomo, że taktowanie i liczba rdzeni procesora bezpośrednio wpływa na poziom wydajności, zwłaszcza w projektach wątkowych. Postanowiliśmy sprawdzić, jaką rolę odgrywa w tym pamięć podręczna L3?

Aby zbadać ten problem, sklep internetowy pcshop.ua udostępnił nam dwurdzeniowy procesor o nominalnej częstotliwości pracy 3,7 GHz i 3 MB pamięci podręcznej L3 z 12 kanałami asocjacyjnymi. Przeciwnikiem był 4-rdzeniowy, w którym dwa rdzenie zostały wyłączone, a częstotliwość taktowania została zmniejszona do 3,7 GHz. Posiada 8 MB pamięci podręcznej L3 i 16 kanałów asocjacyjnych. Oznacza to, że kluczowa różnica między nimi leży właśnie w pamięci podręcznej ostatniego poziomu: Core i7 ma jej o 5 MB więcej.

Jeśli ma to zauważalny wpływ na wydajność, możliwe będzie przeprowadzenie kolejnego testu z przedstawicielem serii Core i5, który ma na pokładzie 6 MB pamięci podręcznej L3.

Ale na razie wróćmy do obecnego testu. Uczestników wspomagać będzie karta graficzna oraz 16 GB pamięci RAM DDR4-2400 MHz. Porównamy te systemy w rozdzielczości Full HD.

Na początek zacznijmy od niezsynchronizowanych rozgrywek na żywo, w których nie da się jednoznacznie określić zwycięzcy. W Umierające światło przy maksymalnych ustawieniach jakości oba systemy pokazują komfortowy poziom FPS, chociaż obciążenie procesora i karty graficznej było średnio wyższe w przypadku Intel Core i7.

Arma 3 ma wyraźną zależność od procesora, co oznacza, że ​​większa ilość pamięci podręcznej powinna odgrywać pozytywną rolę nawet przy bardzo wysokich ustawieniach graficznych. Co więcej, obciążenie karty graficznej w obu przypadkach osiągnęło maksymalnie 60%.

Gra LOS na ultrawysokich ustawieniach graficznych pozwalał na synchronizację tylko kilku pierwszych klatek, gdzie przewaga Core i7 to około 10 FPS. Desynchronizacja dalszej rozgrywki nie pozwala na określenie stopnia wpływu pamięci podręcznej na szybkość sekwencji wideo. W każdym razie częstotliwość została utrzymana powyżej 120 kl/s, więc nawet 10 FPS nie ma specjalnego wpływu na komfort przechodzenia.

Kończy mini-serię rozgrywki na żywo Ewoluować Etap 2. Tutaj z pewnością zauważylibyśmy różnicę między systemami, ponieważ w obu przypadkach karta wideo jest w przybliżeniu załadowana w połowie. Dlatego subiektywnie wydaje się, że poziom FPS w przypadku Core i7 jest wyższy, ale nie można powiedzieć na pewno, skoro sceny nie są identyczne.

Benchmarki zapewniają bardziej pouczający obraz. Na przykład w GTA V widać, że poza miastem przewaga pamięci podręcznej 8 MB sięga 5-6 klatek/s, a w mieście - do 10 FPS ze względu na wyższe obciążenie karty graficznej. Jednocześnie sam akcelerator wideo w obu przypadkach jest daleki od maksymalnego obciążenia i wszystko zależy od procesora.

Trzeci Wiedźmin wystartowaliśmy z szokującymi ustawieniami graficznymi i wysokim profilem przetwarzania końcowego. W jednej ze oskryptowanych scen przewaga Core i7 w niektórych miejscach sięga 6-8 FPS z ostrą zmianą kąta i koniecznością ładowania nowych danych. Gdy obciążenie procesora i karty graficznej ponownie osiągnie 100%, różnica spada do 2-3 klatek.

Maks. ustawienie wstępne ustawienia graficzne w XCOM 2 nie stał się poważnym testem dla obu systemów, a liczba klatek na sekundę była w okolicach 100 FPS. Ale i tutaj większa ilość pamięci podręcznej została zamieniona na wzrost szybkości z 2 do 12 klatek/s. I chociaż oba procesory nie potrafiły maksymalnie załadować karty graficznej, wersja 8 MB w niektórych miejscach radziła sobie lepiej w tej kwestii.

Najbardziej niesamowita gra Rajd brudu, który uruchomiliśmy z bardzo wysokim ustawieniem. W niektórych momentach różnica sięgała 25 klatek/s wyłącznie dzięki większej pamięci podręcznej L3. Pozwoliło to na 10-15% lepsze ładowanie karty graficznej. Jednak średnie wyniki benchmarku pokazały skromniejsze zwycięstwo Core i7 - tylko 11 FPS.

Ciekawa sytuacja powstała z Rainbow Six Siege: na ulicy, w pierwszych klatkach benchmarku, przewaga Core i7 wynosiła 10-15 FPS. W pomieszczeniu ładowanie procesora i karty graficznej w obu przypadkach osiągnęło 100%, więc różnica zmniejszyła się do 3-6 FPS. Ale w końcu, gdy kamera wyprowadziła się z domu, Core i3 znów opóźniał się w miejscach powyżej 10 kl./s. Średnia okazała się być na poziomie 7 FPS na korzyść 8 MB pamięci podręcznej.

Dywizja w maksymalna jakość grafika również dobrze reaguje na zwiększoną pamięć podręczną. Już pierwsze klatki benchmarka w pełni ładowały wszystkie wątki Core i3, ale łączne obciążenie Core i7 wyniosło 70-80%. Jednak różnica w szybkości w tych momentach wynosiła tylko 2-3 FPS. Nieco później obciążenie obu procesorów osiągnęło 100%, a w pewnych momentach różnica przekraczała już Core i3, ale tylko o 1-2 klatki/s. Średnio było to około 1 FPS na korzyść Core i7.

Z kolei benchmarkRise of Tomb Riderprzy wysokich ustawieniach graficznych we wszystkich trzech scenach testowych wyraźnie pokazało to przewagę procesora ze znacznie większą pamięcią podręczną. Jego średnia wydajność jest lepsza o 5-6 FPS, ale jeśli uważnie przyjrzysz się każdej scenie, to w niektórych miejscach Core i3 opóźnia się o ponad 10 klatek/s.

Ale przy wyborze ustawienia wstępnego z bardzo wysokimi ustawieniami zwiększa się obciążenie karty graficznej i procesorów, więc w większości różnica między systemami zmniejsza się do kilku klatek. I tylko przez krótki czas Core i7 może pokazać bardziej znaczące wyniki. Zgodnie z wynikami benchmarku średnie wskaźniki jego przewagi spadły do ​​3-4 FPS.

Wynajęty morderca również mniej dotknięty przez pamięć podręczną L3. Jednak nawet tutaj, przy bardzo wysokim profilu szczegółowości, dodatkowe 5 MB zapewniało lepsze ładowanie karty graficznej, zamieniając to w dodatkowe 3-4 kl/s. Nie mają szczególnie krytycznego wpływu na osiągi, ale z czysto sportowego zainteresowania fajnie, że jest zwycięzca.

Wysokie ustawienia grafiki Deus ex: Ludzkość podzielona natychmiast zażądał maksymalnej mocy obliczeniowej z obu systemów, więc różnica w najlepszy przypadek wyniósł 1-2 klatki na korzyść Core i7, na co wskazuje średnia.

Ponowne uruchomienie na ultrawysokim ustawieniu obciążyło kartę graficzną jeszcze bardziej, więc wpływ procesora na ogólną prędkość stał się jeszcze mniejszy. W związku z tym różnica w pamięci podręcznej L3 praktycznie nie miała wpływu na sytuację, a średni FPS różnił się o mniej niż pół klatki.

Zgodnie z wynikami testów można zauważyć, że wpływ pamięci podręcznej L3 na wydajność w grach ma miejsce, ale objawia się tylko wtedy, gdy karta graficzna nie jest załadowana z pełną pojemnością. W takich przypadkach możliwe byłoby uzyskanie wzrostu o 5-10 FPS, gdyby pamięć podręczna została zwiększona 2,5 razy. Oznacza to, że w przybliżeniu okazuje się, że przy innych warunkach bez zmian, każdy dodatkowy MB pamięci podręcznej L3 dodaje tylko 1-2 FPS do szybkości wyświetlania sekwencji wideo.

Tak więc, jeśli porównamy sąsiednie linie, na przykład Celeron i Pentium, lub modele z różnymi rozmiarami pamięci podręcznej L3 w serii Core i3, to główny wzrost wydajności osiąga się dzięki większej wysokie częstotliwości, a następnie obecność dodatkowych wątków i rdzeni procesora. Dlatego przy wyborze procesora przede wszystkim należy skupić się na głównych cechach, a dopiero potem zwrócić uwagę na ilość pamięci podręcznej.

To wszystko. Dziękuję za uwagę. Mamy nadzieję, że ten materiał był przydatny i interesujący.

Artykuł przeczytany 27046 razy

Subskrybuj nasze kanały

Dzisiejszy artykuł nie jest samodzielnym materiałem - po prostu kontynuuje badanie wydajności trzech generacji architektury Core w równych warunkach (rozpoczęte pod koniec ubiegłego roku i kontynuowane ostatnio). To prawda, że ​​dziś zrobimy mały krok w bok - częstotliwości rdzeni i pamięci podręcznej pozostaną takie same jak wcześniej, ale pojemność tej ostatniej zmniejszy się. Dlaczego jest to potrzebne? Wykorzystaliśmy „pełny” Core i7 ostatnich dwóch generacji, aby zapewnić czystość eksperymentu, testując go z włączoną i wyłączoną obsługą technologie hyper-threading, bo od półtora roku Core i5 jest dostarczany nie z 8, a z 6 MiB L3. Oczywiste jest, że wpływ pojemności pamięci podręcznej na wydajność nie jest tak duży, jak się czasem uważa, ale jest i nie da się od tego uciec. W dodatku Core i5 to bardziej masowo produkowane produkty niż Core i7, a w pierwszej generacji nikt ich nie „obraził” w tym parametrze. Ale wcześniej były nieco inaczej ograniczane: taktowanie UnCore w pierwszej generacji i5 wynosiło tylko 2,13 GHz, więc nasz „Nehalem” nie jest dokładnie przedstawicielem 700. linii taktowania 2,4 GHz, ale nieco szybszym procesorem. Uznaliśmy jednak za niepotrzebne znaczne rozszerzanie listy uczestników i przerabianie warunków testowych - w każdym razie, jak ostrzegaliśmy niejednokrotnie, testowanie tej linii nie wnosi żadnych nowych praktycznych informacji: prawdziwe procesory pracują w zupełnie innych trybach. Ale dla tych, którzy chcą dokładnie zrozumieć wszystkie subtelne punkty, wydaje nam się, że takie testy będą interesujące.

Konfiguracja stanowiska testowego

Postanowiliśmy ograniczyć się tylko do czterech procesorów, a głównych uczestników będzie dwóch: oba czterordzeniowe Ivy Bridge, ale z różnymi pojemnościami pamięci podręcznej L3. Trzeci to „Nehalem HT”: ostatnim razem był prawie identyczny z „Ivy Bridge is simple” pod względem końcowego wyniku. I „tylko Nehalem”, który, jak już powiedzieliśmy, jest nieco szybszy od prawdziwego Core i5 pierwszej generacji, działającego na częstotliwości 2,4 GHz (ze względu na to, że częstotliwość UnCore była nieco niższa w 700. linii) , ale niezbyt radykalne. Ale porównanie też jest interesujące: z jednej strony są dwa kroki do poprawy mikroarchitektury, z drugiej pamięć podręczna jest ograniczona. A priori można założyć, że pierwsze będą przeważać w większości przypadków, ale ile i ogólnie - jak porównywalne są „pierwsze” i „trzecie” i5 (oczywiście skorygowane o częstotliwość UnCore, chociaż jeśli jest ich wiele osoby, które chcą zobaczyć absolutnie dokładne porównanie, zrobimy to) - już dobry temat na badania.

Testowanie

Tradycyjnie dzielimy wszystkie testy na kilka grup i pokazujemy średni wynik dla grupy testów/aplikacji na wykresach (szczegóły dotyczące metodologii testowania w osobnym artykule). Wyniki na wykresach podane są w punktach, dla 100 punktów wydajność wzorca system testowy przykład witryny 2011. Opiera się na Procesor AMD Athlon II X4 620, ale ilość pamięci (8 GB) i karty graficznej () są standardem dla wszystkich testów „głównej linii” i można ją zmienić tylko w ramach specjalnych badań. Dla bardziej zainteresowanych dokładna informacja, ponownie tradycyjnie proponuje się pobranie tabeli w formacie Microsoft Excel, w której wszystkie wyniki są podawane zarówno w przeliczonych punktach, jak iw postaci „naturalnej”.

Praca interaktywna w pakietach 3D

Występuje pewien wpływ pojemności pamięci podręcznej, ale jest to mniej niż 1%. W związku z tym oba Ivy Bridges można uznać za identyczne, ale ulepszenia architektury pozwalają nowemu Core i5 z łatwością wyprzedzić stary Core i7 w taki sam sposób, jak robi to nowy Core i7.

Ostateczne renderowanie scen 3D

W tym przypadku oczywiście żadne ulepszenia nie są w stanie zrekompensować wzrostu liczby przetwarzanych wątków, ale dziś najważniejsze dla nas nie jest to, a całkowita nieobecność wpływ pojemności pamięci podręcznej na wydajność. Tutaj Celeron i Pentium, jak już ustaliliśmy, są różnymi procesorami, więc programy renderujące są wrażliwe na pojemność L3, ale tylko wtedy, gdy ta ostatnia nie wystarcza. A 6 MiB na cztery rdzenie, jak widzimy, w zupełności wystarczy.

Pakowanie i rozpakowywanie

Oczywiście zadania te są podatne na pojemność pamięci podręcznej, ale tutaj efekt zwiększenia jej z 6 do 8 MiB jest dość skromny: około 3,6%. W rzeczywistości ciekawsze jest porównanie z pierwszą generacją - ulepszenia architektoniczne pozwalają nowemu i5 „rozbić” nawet stary i7 przy równych częstotliwościach, ale tak jest w ogólnej klasyfikacji: ze względu na fakt, że dwa z czterech testów są jednowątkowe, a jedno dwuwątkowe. Kompresja danych przez 7-Zip jest oczywiście najszybsza w Nehalem HT: osiem strumieni jest zawsze szybszych niż cztery o porównywalnej wydajności. Ale jeśli ograniczymy się tylko do czterech, nasz „Ivy Bridge 6M” przegrywa nie tylko ze swoim przodkiem, ale także ze starym Nehalem: ulepszenia mikroarchitektury całkowicie ustępują zmniejszeniu pojemności pamięci podręcznej.

Kodowanie dźwięku

Nieco nieoczekiwana była nie wielkość różnicy między dwoma mostami Bluszczowymi, ale fakt, że w ogóle istnieje. Prawda jest tak tania, że ​​można ją również przypisać cechom zaokrągleń lub błędom pomiaru.

Kompilacja

Wątki są ważne, podobnie jak pojemność pamięci podręcznej. Jednak jak zwykle nie za dużo - około 1,5%. Ciekawsze jest porównanie z pierwszą generacją Core z wyłączoną Hyper-Threading: nowy Core i5 wygrywa nawet z taką samą częstotliwością, ale jeden z trzech kompilatorów (a konkretnie Microsoftu) pracował na obu procesorach jednocześnie. Nawet z 5 sekundową przewagą dla starszego - pomimo tego, że w tym programie "pełna pamięć podręczna" Ivy Bridge daje wynik o 4 sekundy lepszy niż Nehalem. Ogólnie rzecz biorąc, tutaj nie można uznać, że spadek pojemności L3 w jakiś sposób znacząco wpłynął na Core i5 drugiej i trzeciej generacji, ale są niuanse.

Obliczenia matematyczno-inżynierskie

Ponownie mniej niż 1% różnicy w stosunku do „starszego” kryształu i znowu przekonujące zwycięstwo nad pierwszą generacją we wszystkich jej formach. Co jest bardziej regułą niż wyjątkiem dla takich niskowątkowych testów, ale dlaczego nie upewnić się o tym jeszcze raz? Zwłaszcza w tak wyrafinowanej formie, gdy (w przeciwieństwie do testów w Tryb normalny) nie zakłóca różnicy częstotliwości („standardowych” lub pojawiających się w wyniku działania Turbo Boost).

Grafika rastrowa

Ale nawet przy pełniejszym wykorzystaniu wielowątkowości obraz nie zawsze się zmienia. A pojemność pamięci podręcznej w ogóle nic nie daje.

Grafika wektorowa

I tutaj jest podobnie. To prawda, że ​​potrzeba tylko kilku wątków obliczeniowych.

Kodowanie wideo

W przeciwieństwie do tej grupy, gdzie jednak nawet Hyper-Threading nie pozwala Nehalem walczyć na równych warunkach z wyznawcami nowszych pokoleń. Ale nie przeszkadza im zbytnio zmniejszenie pojemności pamięci podręcznej. Dokładniej, praktycznie w ogóle nie przeszkadza, ponieważ różnica jest ponownie mniejsza niż 1%.

Oprogramowanie biurowe

Zgodnie z oczekiwaniami, zwiększenie pojemności pamięci podręcznej nie zwiększa wydajności (a dokładniej jej spadek w wyniku jej zmniejszenia). Chociaż jeśli spojrzysz na szczegółowe wyniki, zobaczysz, że jedyny wielowątkowy test w tej grupie (czyli OCR w FineReaderze) jest o około 1,5% szybszy przy 8 MiB L3 niż przy 6 MiB. Wydawałoby się - co to jest 1,5%? Praktycznie nic. Ale z naukowego punktu widzenia to już ciekawe: jak widać, to testy wielowątkowe, którym najczęściej brakuje pamięci podręcznej. W rezultacie różnica (choć niewielka) jest czasem nawet tam, gdzie nie powinna. Choć nie ma w tym nic tak niewytłumaczalnego – z grubsza mówiąc, w testach niskowątkowych mamy 3-6 MiB na wątek, ale w testach wielowątkowych otrzymujemy 1,5 MiB w tym samym miejscu. Pierwszy to dużo, ale drugi może nie wystarczyć.

Jawa

Maszyna Java nie zgadza się jednak z tą oceną, ale to też jest zrozumiałe: jak już nie raz pisaliśmy, jest bardzo dobrze zoptymalizowana w ogóle nie pod procesory x86, ale pod telefony i ekspresy do kawy, gdzie może być wiele rdzeni, ale tutaj jest pamięć podręczna bardzo mało pamięci. A czasami jest mało rdzeni i pamięci podręcznej - drogie zasoby zarówno pod względem powierzchni chipa, jak i zużycia energii. A jeśli coś można zrobić z rdzeniami i megahercami, to z pamięcią podręczną wszystko jest trudniejsze: na przykład w czterordzeniowej Tegrze 3 jest to tylko 1 MiB. Oczywiste jest, że JVM może „gruntować” jeszcze więcej (jak wszystkie systemy z kodem bajtowym), co już widzieliśmy porównując Celeron i Pentium, ale ponad 1,5 MiB na wątek, jeśli może się przydać, to nie w tych zadaniach , które są zawarte w SPECjvm 2008.

Gry

Spore nadzieje wiązaliśmy z grami, ponieważ często okazują się one bardziej wymagające niż nawet archiwizatory pod względem pojemności pamięci podręcznej. Ale dzieje się tak, gdy jest bardzo mały, a 6 MiB - jak widzimy, wystarczy. I znowu, procesory z czterordzeniowym rdzeniem dowolnej generacji, nawet taktowane częstotliwością 2,4 GHz, są zbyt potężnym rozwiązaniem dla używanych aplikacji do gier, więc oczywiście nie będą wąskim gardłem, ale inne komponenty systemu. Dlatego postanowiliśmy strzepnąć kurz z trybów o niskiej jakości grafiki – widać, że dla takich systemów jest to zbyt syntetyczne, ale mamy wszystkie syntetyczne testy :)

Kiedy wszelkiego rodzaju karty graficzne i tak dalej nie przeszkadzają, różnica między dwoma mostami Ivy osiąga już „szalony” 3%: w tym przypadku możesz to zignorować w praktyce, ale w teorii to dużo. Więcej wyszło tylko w archiwach.

Środowisko wielozadaniowe

Gdzieś już to widzieliśmy. No tak – kiedy testowaliśmy procesory sześciordzeniowe pod LGA2011. A teraz sytuacja się powtarza: obciążenie jest wielowątkowe, niektóre używane programy są „chciwe” na pamięć podręczną, ale jej wzrost zmniejsza tylko średnią wydajność. Jak można to wyjaśnić? Chyba, że ​​arbitraż się komplikuje i rośnie liczba chybień. Co więcej, zauważamy, że dzieje się tak tylko wtedy, gdy pojemność L3 jest stosunkowo duża i działają jednocześnie co najmniej cztery wątki obliczeniowe - w segmencie budżetowym zupełnie inny obraz. W każdym razie, jak pokazały nasze ostatnie testy Pentium i Celeron, w przypadku procesorów dwurdzeniowych zwiększenie L3 z 2 do 3 MiB zwiększa wydajność o 6%. Ale cztero- i sześciordzeniowy nie daje, delikatnie mówiąc, nic. Nawet mniej niż nic.

Całkowity

Logiczny wynik ogólny: ponieważ nigdzie nie znaleziono żadnej znaczącej różnicy między procesorami o różnych rozmiarach L3, nie ma też żadnej w „ogóle i całości”. Nie ma więc powodów do denerwowania się spadkiem pojemności pamięci podręcznej w Core i5 drugiej i trzeciej generacji – poprzednicy pierwszej generacji i tak nie są dla nich konkurentami. Tak, a stary Core i7 przeciętnie również wykazuje tylko podobny poziom wydajności (oczywiście, głównie ze względu na lagi w aplikacjach niskowątkowych – a są scenariusze, w których mogą sobie poradzić szybciej w równych warunkach). Ale, jak już powiedzieliśmy, w praktyce rzeczywiste procesory są dalekie od równych pod względem częstotliwości, więc praktyczna różnica między generacjami jest większa niż można uzyskać w takich badaniach.

Tylko jedno pytanie pozostaje otwarte: musieliśmy znacznie zmniejszyć częstotliwość zegara zapewnić równość warunków z rdzeniem pierwszej generacji, ale czy zaobserwowane wzorce utrzymają się w warunkach bliższych rzeczywistości? W końcu fakt, że cztery wątki o niskiej szybkości obliczeniowej nie widzą różnicy między 6 a 8 MiB pamięci podręcznej, nie oznacza, że ​​nie znajdzie się ona w przypadku czterech szybkich. Co prawda nie dzieje się odwrotnie, więc aby ostatecznie zamknąć temat badań teoretycznych, potrzebujemy jeszcze jednego Praca laboratoryjna którym zajmiemy się następnym razem.

Podobał Ci się artykuł? Podziel się z przyjaciółmi!
Czy ten artykuł był pomocny?
TAk
Nie
Dziękuję za opinię!
Coś poszło nie tak i Twój głos nie został policzony.
Dzięki. Twoja wiadomość została wysłana
Znalazłeś błąd w tekście?
Wybierz, kliknij Ctrl+Enter a my to naprawimy!