Comment comparer correctement les processeurs de flux AMD et les cœurs NVIDIA CUDA


Meilleure réponse

AMD a mis plus de poids sur le parallélisme au niveau des threads. Il prend en charge 40 threads en vol par pipeline de GPU.

Nvidia sest concentré sur de meilleures performances de cache et une communication thread-thread. Par exemple, vous pouvez envoyer des données de pipeline-1 à pipeline-2 directement en 1 cycle à laide de linstruction warp shuffle. Si vous voulez envoyer des données de pipeline-1 à pipeline-1024, vous devez utiliser le cache / mémoire partagée qui est également plus rapide que son homologue Amd.

Pour faire un benchmark équitable, je le ferais

  • augmenter le nombre déléments de travail envoyés au GPU AMD afin quils remplissent complètement ses pipelines
  • optimiser avec des distorsions de distorsion, etc. pour Nvidia.

Pour un comparaison matérielle directe, chaque série de GPU doit être considérée et ce serait une comparaison très complexe avec beaucoup de choses sur papier. Le meilleur moyen de connaître les performances est le benchmarking.

Par exemple, sil existe un benchmark de simulation de galaxies à N corps, jaurais plusieurs threads par masse dans AMD et 1 thread par masse dans Nvidia. Ensuite, joptimiserais les deux en utilisant le «carrelage» sur la mémoire partagée rapide. Mais sur Nvidia, jajouterais une deuxième couche de «carrelage» en utilisant des distorsions de distorsion. Les warp shuffles partagent efficacement le stockage des registres avec les pipelines voisins afin que la dépendance de la mémoire diminue et que les performances augmentent. Mais ce nest que CUDA. OpenCL ne dépend pas de la plate-forme en échangeant un potentiel de gain de performances.

Réponse

AMD vend actuellement des processeurs avec entre 2 et 64 cœurs de processeur. Voici une liste des différentes gammes et séries de produits AMD CPU / APU (les APU sont ce quAMD appelle leurs CPU avec graphiques intégrés), et leur nombre de cœurs correspondant.

Notez que chacune de ces gammes de produits contient plusieurs générations et modèles spécifiques ou «SKU» (Stock Keeping Units) de CPU, ainsi, par exemple, un Ryzen 7 1700 est plus lent quun Ryzen 7 3700X, même sil sagit de processeurs Ryzen 7 8 cœurs:

Série A (APU de faible puissance construits sur des architectures de «bulldozer» obsolètes et inefficaces. Habituellement inutile dacheter):

  • A4 – 2 cœurs
  • A6 – 2 noyaux
  • A8 – 4 noyaux
  • A9 – 2 noyaux
  • A10 – 4 noyaux
  • A12 – 4 noyaux

Série Athlon X (comme la série A, mais sans les graphiques. Ne pas acheter.)

  • Athlon X2 – 2 cœurs
  • Athlon X4 – 4 cœurs

Série FX (processeurs «bulldozer» Semblables à la série A, mais sans graphiques intégrés, et un peu plus rapides. Difficile de refroidir suffisamment. Habituellement, cela ne vaut pas la peine dacheter )

  • FX 4xxx – 4 cœurs
  • FX 6xxx – 6 cœurs
  • FX 8xxx – 8 cœurs
  • FX 9xxx – 8 cœurs

Série Athlon G (APU bon marché construits sur des architectures «Zen» modernes avec de bons graphiques intégrés. Une bonne option bas de gamme, car chacun des cœurs est beaucoup plus rapide que deux cœurs de bulldozer)

  • (toutes les variantes) – 2 cœurs

Série Ryzen (processeurs «Zen» de milieu de gamme à haut de gamme, avec des performances multicœurs élevées. Comprend également certains APU avec des graphiques intégrés puissants – ceux dont le nom de modèle se termine par «G»)

  • Ryzen 3 – 4 cœurs
  • Ryzen 5 – 6 cœurs (4 cœurs pour les APU)
  • Ryzen 7 – 8 cœurs
  • Ryzen 9 – 12 ou 16 cœurs
  • Ryzen Threadripper – 8 à 64 cœurs (destinés aux ordinateurs de bureau haut de gamme)

Série EPYC (processeurs «Zen» pour serveurs et HPC / supercalculateurs. Peut être utilisé dans les ordinateurs de bureau, mais pas prévu pour cela)

  • EPYC – 8 à 64 cœurs

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *