Beste antwoord
AMD heeft meer aandacht besteed aan thread-level-parallellisme. Het ondersteunt 40 in-flight threads per pijplijn van GPU.
Nvidia heeft zich gericht op betere cacheprestaties en thread-thread-communicatie. U kunt bijvoorbeeld gegevens van pipeline-1 naar pipeline-2 direct in 1 cyclus verzenden met behulp van warp shuffle-instructie. Als je gegevens van pipeline-1 naar pipeline-1024 wilt verzenden, moet je cache / gedeeld geheugen gebruiken dat ook sneller is dan zijn Amd-tegenhanger.
Om een eerlijke benchmark te maken, zou ik
- het aantal werkitems verhogen dat naar de AMD GPU wordt gestuurd, zodat ze de pijplijnen volledig vullen
- optimaliseren met warp shuffles enz. voor Nvidia.
Voor een directe hardware-vergelijking, elke serie GPUs moet worden overwogen en het zou een zeer complexe vergelijking zijn met veel dingen op papier. De beste manier om de prestaties te kennen, is benchmarking.
Als er bijvoorbeeld een N-body galaxy-simulatiebenchmark is, zou ik meerdere threads per massa hebben in AMD en 1 thread per massa in Nvidia. Dan zou ik beide optimaliseren met behulp van “tegels” op snel gedeeld geheugen. Maar op Nvidia zou ik een tweede laag “tegels” toevoegen met behulp van warp-shuffles. Warp shuffles delen effectief registeropslag met buurpijplijnen, zodat de geheugenafhankelijkheid afneemt en de prestaties toenemen. Maar het is alleen CUDA. OpenCL is niet platformafhankelijk door enig potentieel voor prestatiewinst te verhandelen.
Antwoord
AMD verkoopt momenteel processors met 2 tot 64 CPU-cores. Hier is een lijst met verschillende AMD CPU / APUs (APUs zijn wat AMD hun CPUs met geïntegreerde grafische kaart noemt) productlijnen en series, en hun corresponderende kernaantal.
Merk op dat elk van deze productlijnen verschillende verschillende generaties en specifieke modellen of “SKUs” (Stock Keeping Units) van de CPU, dus een Ryzen 7 1700 is bijvoorbeeld langzamer dan een Ryzen 7 3700X, ook al zijn ze beide 8-core Ryzen 7 CPUs:
A-serie (APUs met laag vermogen gebouwd op verouderde en inefficiënte “bulldozer” -architecturen. Meestal niet waard om te kopen):
- A4 – 2 cores
- A6 – 2 aders
- A8 – 4 aders
- A9 – 2 aders
- A10 – 4 aders
- A12 – 4 aders
Athlon X-serie (zoals de A-serie, maar zonder de graphics. Niet kopen.)
- Athlon X2 – 2 cores
- Athlon X4 – 4 cores
FX-serie (“bulldozer” CPUs vergelijkbaar met de A-serie, maar zonder geïntegreerde grafische kaart, en een beetje sneller. Moeilijk voldoende te koelen. Meestal niet waard om te kopen )
- FX 4xxx – 4 kernen
- FX 6xxx – 6 kernen
- FX 8xxx – 8 kernen
- FX 9xxx – 8 cores
Athlon G-serie (goedkope APUs gebouwd op moderne “Zen” -architecturen met goede geïntegreerde grafische afbeeldingen. Een goede low-end optie, aangezien elk van de kernen veel sneller is dan twee bulldozer-kernen)
- (alle varianten) – 2 kernen
Ryzen-serie (midrange tot high-end “Zen” CPUs, met hoge multicore-prestaties. Bevat ook enkele APUs met krachtige geïntegreerde grafische kaart – die met een modelnaam die eindigt op “G”)
- Ryzen 3 – 4 cores
- Ryzen 5 – 6 cores (4 cores voor APUs)
- Ryzen 7 – 8 cores
- Ryzen 9 – 12 of 16 cores
- Ryzen Threadripper – 8 tot 64 cores (bedoeld voor high-end werkstation-pcs)
EPYC-serie (server en HPC / supercomputer “Zen” CPUs. Kan worden gebruikt in desktops, maar niet daarvoor bedoeld)
- EPYC – 8 tot 64 cores