Nejlepší odpověď
AMD přikládá větší váhu paralelismu na úrovni vláken. Podporuje 40 podprocesů za letu na potrubí GPU.
Nvidia se zaměřila na lepší výkon mezipaměti a komunikaci mezi podprocesy. Například můžete poslat data z pipeline-1 do pipeline-2 přímo v 1 cyklu pomocí instrukce warp shuffle. Pokud chcete odesílat data z pipeline-1 do pipeline-1024, musíte použít mezipaměť / sdílenou paměť, která je také rychlejší než její protějšek Amd.
Abych vytvořil spravedlivé měřítko, chtěl bych
- zvýšit počet pracovních položek odeslaných na AMD GPU tak, aby plně naplnily jeho kanály
- optimalizovat pomocí warp shuffles atd. pro Nvidia.
Pro přímé hardwarové srovnání, je třeba vzít v úvahu každou sérii GPU a bylo by to velmi složité srovnání s mnoha věcmi na papíře. Nejlepší způsob, jak zjistit výkon, je srovnávací test.
Například pokud existuje srovnávací test simulace galaxií N-těla, měl bych více vláken na hmotu v AMD a 1 vlákno na hmotu v Nvidii. Pak bych obě optimalizoval pomocí „obkladu“ na rychlé sdílené paměti. Ale na Nvidii bych přidal druhou vrstvu „obkladů“ pomocí warp shuffles. Warp shuffles efektivně sdílí úložiště registrů se sousedními kanály, takže se snižuje závislost paměti a zvyšuje výkon. Ale je to jen CUDA. OpenCL není závislý na platformě obchodováním s určitým potenciálem zvýšení výkonu.
Odpovědět
AMD v současné době prodává procesory se 2 až 64 jádry CPU. Zde je seznam různých produktových řad a sérií AMD CPU / APU (APU jsou tím, čemu AMD říká jejich CPU s integrovanou grafikou) a jejich počet odpovídajících jader.
Pamatujte, že každá z těchto produktových řad obsahuje několik různých generace a konkrétní modely nebo „SKU“ (Stock Keeping Units) CPU, takže například Ryzen 7 1700 je pomalejší než Ryzen 7 3700X, i když jsou oba 8jádrové Ryzen 7 CPU:
Řada A (APU s nízkým výkonem postavené na zastaralých a neefektivních architekturách „buldozerů“. Obvykle se neoplatí kupovat):
- A4 – 2 jádra
- A6 – 2 jádra
- A8 – 4 jádra
- A9 – 2 jádra
- A10 – 4 jádra
- A12 – 4 jádra
Řada Athlon X (jako řada A, ale bez grafiky. Nekupujte.)
- Athlon X2 – 2 jádra
- Athlon X4 – 4 jádra
Řada FX (procesory „buldozeru“ Podobné jako řada A, ale bez integrované grafiky a o něco rychlejší. Obtížné dostatečně ochladit. Obvykle se neoplatí kupovat )
- FX 4xxx – 4 jádra
- FX 6xxx – 6 jader
- FX 8xxx – 8 jader
- FX 9xxx – 8 jader
Řada Athlon G (levné APU postavené na moderních „Zen“ architekturách s dobrou integrovanou grafikou. Dobrá volba pro low-end, protože každé z jader je mnohem rychlejší než dvě jádra buldozeru)
- (všechny varianty) – 2 jádra
řada Ryzen (střední až špičkové procesory „Zen“ s vysokým vícejádrovým výkonem. Zahrnuje také některé APU s výkonnou integrovanou grafikou – ty, jejichž název modelu končí na „G“)
- Ryzen 3 – 4 jádra
- Ryzen 5 – 6 jader (4 jádra pro APU)
- Ryzen 7 – 8 jader
- Ryzen 9 – 12 nebo 16 jader
- Ryzen Threadripper – 8 až 64 jader (určených pro špičkové pracovní stanice)
Řada EPYC (server a CPU „Zen“ HPC / superpočítače. Lze použít na stolních počítačích, ale ne k tomu určeno)
- EPYC – 8 až 64 jader