Jak prawidłowo porównać procesory AMD Stream z rdzeniami NVIDIA CUDA


Najlepsza odpowiedź

AMD położyło większy nacisk na równoległość na poziomie wątków. Obsługuje 40 wątków w locie na potok GPU.

Nvidia skupiła się na lepszej wydajności pamięci podręcznej i komunikacji wątkowo-wątkowej. Na przykład, możesz wysłać dane z pipeline-1 do pipeline-2 bezpośrednio w 1 cyklu, używając instrukcji warp shuffle. Jeśli chcesz wysłać dane z pipeline-1 do pipeline-1024, musisz użyć pamięci podręcznej / współdzielonej, która jest również szybsza niż jej odpowiednik Amd.

Aby wykonać uczciwy test porównawczy,

  • zwiększ liczbę elementów roboczych wysyłanych do procesora graficznego AMD, aby w pełni wypełniały jego potoki.
  • zoptymalizuj za pomocą tasowań warp itp. dla Nvidii.

bezpośrednie porównanie sprzętu, należy wziąć pod uwagę każdą serię procesorów graficznych i byłoby to bardzo złożone porównanie z wieloma rzeczami na papierze. Najlepszym sposobem poznania wydajności jest test porównawczy.

Na przykład, jeśli istnieje test porównawczy symulacji galaktyki N-ciał, miałbym wiele wątków na masę w AMD i 1 wątek na masę w Nvidii. Następnie zoptymalizowałbym oba za pomocą „kafelkowania” na szybkiej pamięci współdzielonej. Ale na Nvidii dodałbym drugą warstwę „kafelkowania” przy użyciu tasowania warp. Tasowanie wypaczania efektywnie współużytkuje pamięć rejestrów z sąsiednimi potokami, co zmniejsza zależność pamięci i zwiększa wydajność. Ale to tylko CUDA. OpenCL nie jest zależny od platformy, handlując pewnym potencjałem wzrostu wydajności.

Odpowiedź

AMD obecnie sprzedaje procesory z dowolnymi od 2 do 64 rdzeni. Oto lista różnych linii i serii produktów AMD CPU / APU (APU to tak zwane procesory AMD ze zintegrowaną grafiką) oraz odpowiadająca im liczba rdzeni.

Zauważ, że każda z tych linii produktów zawiera kilka różnych generacje i określone modele lub „jednostki magazynowe” procesora, więc na przykład Ryzen 7 1700 jest wolniejszy niż Ryzen 7 3700X, mimo że oba są 8-rdzeniowymi procesorami Ryzen 7:

Seria A (energooszczędne APU zbudowane na przestarzałej i nieefektywnej architekturze „buldożera”. Zwykle nie warto kupować):

  • A4 – 2 rdzenie
  • A6 – 2 rdzenie
  • A8 – 4 rdzenie
  • A9 – 2 rdzenie
  • A10 – 4 rdzenie
  • A12 – 4 rdzenie

Seria Athlon X (podobnie jak seria A, ale bez grafiki. Nie kupuj.)

  • Athlon X2 – 2 rdzenie
  • Athlon X4 – 4 rdzenie

Seria FX (procesory „buldożer” podobne do serii A, ale bez zintegrowanej grafiki i nieco szybsze. Trudne do dostatecznego chłodzenia. Zwykle nie warto kupować) )

  • FX 4xxx – 4 rdzenie
  • FX 6xxx – 6 rdzeni
  • FX 8xxx – 8 rdzeni
  • FX 9xxx – 8 rdzeni

Seria Athlon G (tanie APU zbudowane na nowoczesnej architekturze „Zen” z dobrą zintegrowaną grafiką. Dobra opcja low-end, ponieważ każdy z rdzeni jest znacznie szybszy niż dwa rdzenie buldożera)

  • (wszystkie warianty) – 2 rdzenie

Seria Ryzen (średnie i zaawansowane procesory „Zen” z wysoką wydajnością wielordzeniową. Obejmuje również niektóre APU z wydajną zintegrowaną grafiką – te z nazwą modelu kończącą się na „G”)

  • Ryzen 3 – 4 rdzenie
  • Ryzen 5-6 rdzeni (4 rdzenie dla APU)
  • Ryzen 7-8 rdzeni
  • Ryzen 9-12 lub 16 rdzeni
  • Ryzen Threadripper – od 8 do 64 rdzeni (przeznaczone do komputerów stacjonarnych high-end)

Seria EPYC (procesory serwerowe i HPC / superkomputer „Zen”. Mogą być używane w komputerach stacjonarnych, ale nie przeznaczone do tego celu)

  • EPYC – od 8 do 64 rdzeni

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *