Jak prawidłowo porównać procesory AMD Stream z rdzeniami NVIDIA CUDA

Najlepsza odpowiedź

AMD położyło większy nacisk na równoległość na poziomie wątków. Obsługuje 40 wątków w locie na potok GPU.

Nvidia skupiła się na lepszej wydajności pamięci podręcznej i komunikacji wątkowo-wątkowej. Na przykład, możesz wysłać dane z pipeline-1 do pipeline-2 bezpośrednio w 1 cyklu, używając instrukcji warp shuffle. Jeśli chcesz wysłać dane z pipeline-1 do pipeline-1024, musisz użyć pamięci podręcznej / współdzielonej, która jest również szybsza niż jej odpowiednik Amd.

Aby wykonać uczciwy test porównawczy,

zwiększ liczbę elementów roboczych wysyłanych do procesora graficznego AMD, aby w pełni wypełniały jego potoki.
zoptymalizuj za pomocą tasowań warp itp. dla Nvidii.

bezpośrednie porównanie sprzętu, należy wziąć pod uwagę każdą serię procesorów graficznych i byłoby to bardzo złożone porównanie z wieloma rzeczami na papierze. Najlepszym sposobem poznania wydajności jest test porównawczy.

Na przykład, jeśli istnieje test porównawczy symulacji galaktyki N-ciał, miałbym wiele wątków na masę w AMD i 1 wątek na masę w Nvidii. Następnie zoptymalizowałbym oba za pomocą „kafelkowania” na szybkiej pamięci współdzielonej. Ale na Nvidii dodałbym drugą warstwę „kafelkowania” przy użyciu tasowania warp. Tasowanie wypaczania efektywnie współużytkuje pamięć rejestrów z sąsiednimi potokami, co zmniejsza zależność pamięci i zwiększa wydajność. Ale to tylko CUDA. OpenCL nie jest zależny od platformy, handlując pewnym potencjałem wzrostu wydajności.

Odpowiedź

AMD obecnie sprzedaje procesory z dowolnymi od 2 do 64 rdzeni. Oto lista różnych linii i serii produktów AMD CPU / APU (APU to tak zwane procesory AMD ze zintegrowaną grafiką) oraz odpowiadająca im liczba rdzeni.

Zauważ, że każda z tych linii produktów zawiera kilka różnych generacje i określone modele lub „jednostki magazynowe” procesora, więc na przykład Ryzen 7 1700 jest wolniejszy niż Ryzen 7 3700X, mimo że oba są 8-rdzeniowymi procesorami Ryzen 7:

Seria A (energooszczędne APU zbudowane na przestarzałej i nieefektywnej architekturze „buldożera”. Zwykle nie warto kupować):

A4 – 2 rdzenie
A6 – 2 rdzenie
A8 – 4 rdzenie
A9 – 2 rdzenie
A10 – 4 rdzenie
A12 – 4 rdzenie

Seria Athlon X (podobnie jak seria A, ale bez grafiki. Nie kupuj.)

Athlon X2 – 2 rdzenie
Athlon X4 – 4 rdzenie

Seria FX (procesory „buldożer” podobne do serii A, ale bez zintegrowanej grafiki i nieco szybsze. Trudne do dostatecznego chłodzenia. Zwykle nie warto kupować) )

FX 4xxx – 4 rdzenie
FX 6xxx – 6 rdzeni
FX 8xxx – 8 rdzeni
FX 9xxx – 8 rdzeni

Seria Athlon G (tanie APU zbudowane na nowoczesnej architekturze „Zen” z dobrą zintegrowaną grafiką. Dobra opcja low-end, ponieważ każdy z rdzeni jest znacznie szybszy niż dwa rdzenie buldożera)

(wszystkie warianty) – 2 rdzenie

Seria Ryzen (średnie i zaawansowane procesory „Zen” z wysoką wydajnością wielordzeniową. Obejmuje również niektóre APU z wydajną zintegrowaną grafiką – te z nazwą modelu kończącą się na „G”)

Ryzen 3 – 4 rdzenie
Ryzen 5-6 rdzeni (4 rdzenie dla APU)
Ryzen 7-8 rdzeni
Ryzen 9-12 lub 16 rdzeni
Ryzen Threadripper – od 8 do 64 rdzeni (przeznaczone do komputerów stacjonarnych high-end)

Seria EPYC (procesory serwerowe i HPC / superkomputer „Zen”. Mogą być używane w komputerach stacjonarnych, ale nie przeznaczone do tego celu)

EPYC – od 8 do 64 rdzeni

Najlepsza odpowiedź

Odpowiedź

Dodaj komentarz Anuluj pisanie odpowiedzi