Bedste svar
AMD har lagt mere vægt på trådniveau-parallelitet. Det understøtter 40 tråde under flyvning pr. Pipeline af GPU.
Nvidia har fokuseret på bedre cacheydelse og tråd-trådkommunikation. For eksempel kan du sende data fra pipeline-1 til pipeline-2 direkte i en cyklus ved hjælp af warp shuffle-instruktion. Hvis du vil sende data fra pipeline-1 til pipeline-1024, skal du bruge cache / delt hukommelse, som også er hurtigere end dens Amd-modstykke.
For at lave en retfærdig benchmark ville jeg
- øg antallet af arbejdsemner, der sendes til AMD GPU, så de fuldt ud udfylder rørledningerne
- optimeres med warp shuffles osv. til Nvidia.
For en direkte hardware-sammenligning, skal hver serie af GPUer overvejes, og det ville være en meget kompleks sammenligning med mange ting på papiret. Den bedste måde at vide ydeevne på er benchmarking.
Hvis der for eksempel er et N-body galaxy simulation benchmark, ville jeg have flere tråde pr. Masse i AMD og 1 tråd pr. Masse i Nvidia. Så ville jeg optimere begge ved hjælp af “tiling” på hurtig delt hukommelse. Men på Nvidia tilføjede jeg endnu et lag “fliselægning” ved hjælp af kædeblandinger. Warp shuffles deler effektivt registerlagring med nabo-rørledninger, så hukommelsesafhængigheden falder og ydeevnen øges. Men det er kun CUDA. OpenCL er ikke platformafhængig ved at handle med et vis præstationsgevinstpotentiale.
Svar
AMD sælger i øjeblikket processorer med alt fra 2 til 64 CPU-kerner. Her er en liste over forskellige AMD CPU / APU (APUer er, hvad AMD kalder deres CPUer med integreret grafik) produktlinjer og serier og deres tilsvarende kernetal.
Bemærk, at hver af disse produktlinjer indeholder flere forskellige generationer og specifikke modeller eller “SKUer” (Stock Keeping Units) af CPU, så for eksempel er en Ryzen 7 1700 langsommere end en Ryzen 7 3700X, selvom de begge er 8-core Ryzen 7 CPUer:
A-serien (lavt drevne APUer bygget på forældede og ineffektive “bulldozer” -arkitekturer. Normalt ikke værd at købe):
- A4 – 2 kerner
- A6 – 2 kerner
- A8 – 4 kerner
- A9 – 2 kerner
- A10 – 4 kerner
- A12 – 4 kerner
Athlon X-serien (som A-serien, men uden grafikken. Køb ikke.)
- Athlon X2 – 2 kerner
- Athlon X4 – 4 kerner
FX-Series (“bulldozer” CPUer svarende til A-serien, men uden integreret grafik og lidt hurtigere. Svært at køle tilstrækkeligt. Normalt ikke værd at købe )
- FX 4xxx – 4 kerner
- FX 6xxx – 6 kerner
- FX 8xxx – 8 kerner
- FX 9xxx – 8 kerner
Athlon G-serien (billige APUer bygget på moderne “Zen” -arkitekturer med god integreret grafik. En god low-end-mulighed, da hver af kernerne er meget hurtigere end to bulldozer-kerner)
- (alle varianter) – 2 kerner
Ryzen-serien (mellemregistrering til avancerede “Zen” -CPUer med høj multicore-ydeevne. Indeholder også nogle APUer med kraftig integreret grafik – dem med et modelnavn, der ender på “G”)
- Ryzen 3 – 4 kerner
- Ryzen 5-6 kerner (4 kerner til APUer)
- Ryzen 7-8 kerner
- Ryzen 9-12 eller 16 kerner
- Ryzen Threadripper – 8 til 64 kerner (beregnet til avancerede pcer til arbejdsstationer)
EPYC-serien (server- og HPC / supercomputer “Zen” CPUer. Kan bruges i desktops, men ikke beregnet til det)
- EPYC – 8 til 64 kerner