Comment comparer correctement les processeurs de flux AMD et les cœurs NVIDIA CUDA

Meilleure réponse

AMD a mis plus de poids sur le parallélisme au niveau des threads. Il prend en charge 40 threads en vol par pipeline de GPU.

Nvidia sest concentré sur de meilleures performances de cache et une communication thread-thread. Par exemple, vous pouvez envoyer des données de pipeline-1 à pipeline-2 directement en 1 cycle à laide de linstruction warp shuffle. Si vous voulez envoyer des données de pipeline-1 à pipeline-1024, vous devez utiliser le cache / mémoire partagée qui est également plus rapide que son homologue Amd.

Pour faire un benchmark équitable, je le ferais

augmenter le nombre déléments de travail envoyés au GPU AMD afin quils remplissent complètement ses pipelines
optimiser avec des distorsions de distorsion, etc. pour Nvidia.

Pour un comparaison matérielle directe, chaque série de GPU doit être considérée et ce serait une comparaison très complexe avec beaucoup de choses sur papier. Le meilleur moyen de connaître les performances est le benchmarking.

Par exemple, sil existe un benchmark de simulation de galaxies à N corps, jaurais plusieurs threads par masse dans AMD et 1 thread par masse dans Nvidia. Ensuite, joptimiserais les deux en utilisant le «carrelage» sur la mémoire partagée rapide. Mais sur Nvidia, jajouterais une deuxième couche de «carrelage» en utilisant des distorsions de distorsion. Les warp shuffles partagent efficacement le stockage des registres avec les pipelines voisins afin que la dépendance de la mémoire diminue et que les performances augmentent. Mais ce nest que CUDA. OpenCL ne dépend pas de la plate-forme en échangeant un potentiel de gain de performances.

Réponse

AMD vend actuellement des processeurs avec entre 2 et 64 cœurs de processeur. Voici une liste des différentes gammes et séries de produits AMD CPU / APU (les APU sont ce quAMD appelle leurs CPU avec graphiques intégrés), et leur nombre de cœurs correspondant.

Notez que chacune de ces gammes de produits contient plusieurs générations et modèles spécifiques ou «SKU» (Stock Keeping Units) de CPU, ainsi, par exemple, un Ryzen 7 1700 est plus lent quun Ryzen 7 3700X, même sil sagit de processeurs Ryzen 7 8 cœurs:

Série A (APU de faible puissance construits sur des architectures de «bulldozer» obsolètes et inefficaces. Habituellement inutile dacheter):

A4 – 2 cœurs
A6 – 2 noyaux
A8 – 4 noyaux
A9 – 2 noyaux
A10 – 4 noyaux
A12 – 4 noyaux

Série Athlon X (comme la série A, mais sans les graphiques. Ne pas acheter.)

Athlon X2 – 2 cœurs
Athlon X4 – 4 cœurs

Série FX (processeurs «bulldozer» Semblables à la série A, mais sans graphiques intégrés, et un peu plus rapides. Difficile de refroidir suffisamment. Habituellement, cela ne vaut pas la peine dacheter )

FX 4xxx – 4 cœurs
FX 6xxx – 6 cœurs
FX 8xxx – 8 cœurs
FX 9xxx – 8 cœurs

Série Athlon G (APU bon marché construits sur des architectures «Zen» modernes avec de bons graphiques intégrés. Une bonne option bas de gamme, car chacun des cœurs est beaucoup plus rapide que deux cœurs de bulldozer)

(toutes les variantes) – 2 cœurs

Série Ryzen (processeurs «Zen» de milieu de gamme à haut de gamme, avec des performances multicœurs élevées. Comprend également certains APU avec des graphiques intégrés puissants – ceux dont le nom de modèle se termine par «G»)

Ryzen 3 – 4 cœurs
Ryzen 5 – 6 cœurs (4 cœurs pour les APU)
Ryzen 7 – 8 cœurs
Ryzen 9 – 12 ou 16 cœurs
Ryzen Threadripper – 8 à 64 cœurs (destinés aux ordinateurs de bureau haut de gamme)

Série EPYC (processeurs «Zen» pour serveurs et HPC / supercalculateurs. Peut être utilisé dans les ordinateurs de bureau, mais pas prévu pour cela)

EPYC – 8 à 64 cœurs

Meilleure réponse

Réponse

Laisser un commentaire Annuler la réponse