Najlepsza odpowiedź
AMD położyło większy nacisk na równoległość na poziomie wątków. Obsługuje 40 wątków w locie na potok GPU.
Nvidia skupiła się na lepszej wydajności pamięci podręcznej i komunikacji wątkowo-wątkowej. Na przykład, możesz wysłać dane z pipeline-1 do pipeline-2 bezpośrednio w 1 cyklu, używając instrukcji warp shuffle. Jeśli chcesz wysłać dane z pipeline-1 do pipeline-1024, musisz użyć pamięci podręcznej / współdzielonej, która jest również szybsza niż jej odpowiednik Amd.
Aby wykonać uczciwy test porównawczy,
- zwiększ liczbę elementów roboczych wysyłanych do procesora graficznego AMD, aby w pełni wypełniały jego potoki.
- zoptymalizuj za pomocą tasowań warp itp. dla Nvidii.
bezpośrednie porównanie sprzętu, należy wziąć pod uwagę każdą serię procesorów graficznych i byłoby to bardzo złożone porównanie z wieloma rzeczami na papierze. Najlepszym sposobem poznania wydajności jest test porównawczy.
Na przykład, jeśli istnieje test porównawczy symulacji galaktyki N-ciał, miałbym wiele wątków na masę w AMD i 1 wątek na masę w Nvidii. Następnie zoptymalizowałbym oba za pomocą „kafelkowania” na szybkiej pamięci współdzielonej. Ale na Nvidii dodałbym drugą warstwę „kafelkowania” przy użyciu tasowania warp. Tasowanie wypaczania efektywnie współużytkuje pamięć rejestrów z sąsiednimi potokami, co zmniejsza zależność pamięci i zwiększa wydajność. Ale to tylko CUDA. OpenCL nie jest zależny od platformy, handlując pewnym potencjałem wzrostu wydajności.
Odpowiedź
AMD obecnie sprzedaje procesory z dowolnymi od 2 do 64 rdzeni. Oto lista różnych linii i serii produktów AMD CPU / APU (APU to tak zwane procesory AMD ze zintegrowaną grafiką) oraz odpowiadająca im liczba rdzeni.
Zauważ, że każda z tych linii produktów zawiera kilka różnych generacje i określone modele lub „jednostki magazynowe” procesora, więc na przykład Ryzen 7 1700 jest wolniejszy niż Ryzen 7 3700X, mimo że oba są 8-rdzeniowymi procesorami Ryzen 7:
Seria A (energooszczędne APU zbudowane na przestarzałej i nieefektywnej architekturze „buldożera”. Zwykle nie warto kupować):
- A4 – 2 rdzenie
- A6 – 2 rdzenie
- A8 – 4 rdzenie
- A9 – 2 rdzenie
- A10 – 4 rdzenie
- A12 – 4 rdzenie
Seria Athlon X (podobnie jak seria A, ale bez grafiki. Nie kupuj.)
- Athlon X2 – 2 rdzenie
- Athlon X4 – 4 rdzenie
Seria FX (procesory „buldożer” podobne do serii A, ale bez zintegrowanej grafiki i nieco szybsze. Trudne do dostatecznego chłodzenia. Zwykle nie warto kupować) )
- FX 4xxx – 4 rdzenie
- FX 6xxx – 6 rdzeni
- FX 8xxx – 8 rdzeni
- FX 9xxx – 8 rdzeni
Seria Athlon G (tanie APU zbudowane na nowoczesnej architekturze „Zen” z dobrą zintegrowaną grafiką. Dobra opcja low-end, ponieważ każdy z rdzeni jest znacznie szybszy niż dwa rdzenie buldożera)
- (wszystkie warianty) – 2 rdzenie
Seria Ryzen (średnie i zaawansowane procesory „Zen” z wysoką wydajnością wielordzeniową. Obejmuje również niektóre APU z wydajną zintegrowaną grafiką – te z nazwą modelu kończącą się na „G”)
- Ryzen 3 – 4 rdzenie
- Ryzen 5-6 rdzeni (4 rdzenie dla APU)
- Ryzen 7-8 rdzeni
- Ryzen 9-12 lub 16 rdzeni
- Ryzen Threadripper – od 8 do 64 rdzeni (przeznaczone do komputerów stacjonarnych high-end)
Seria EPYC (procesory serwerowe i HPC / superkomputer „Zen”. Mogą być używane w komputerach stacjonarnych, ale nie przeznaczone do tego celu)
- EPYC – od 8 do 64 rdzeni