AMDストリームプロセッサとNVIDIACUDAコアを適切に比較する方法


ベストアンサー

AMDは、スレッドレベルの並列処理を重視しています。 GPUのパイプラインごとに実行中の40スレッドをサポートします。

Nvidiaは、キャッシュパフォーマンスとスレッドスレッド通信の向上に重点を置いています。たとえば、ワープシャッフル命令を使用して、パイプライン1からパイプライン2に1サイクルで直接データを送信できます。パイプライン1からパイプライン1024にデータを送信する場合は、キャッシュ/共有メモリを使用する必要があります。これは、Amdの対応するメモリよりも高速です。

公正なベンチマークを作成するには、

  • AMD GPUに送信されるワークアイテムの数を増やして、パイプラインを完全に満たすようにします
  • Nvidiaのワープシャッフルなどで最適化します。

ハードウェアを直接比較するには、GPUのすべてのシリーズを考慮する必要があり、紙の多くのものとの非常に複雑な比較になります。パフォーマンスを知る最良の方法はベンチマークです。

たとえば、N体銀河シミュレーションのベンチマークがある場合、AMDでは質量あたり複数のスレッドがあり、Nvidiaでは質量あたり1つのスレッドがあります。次に、高速共有メモリで「タイリング」を使用して両方を最適化します。しかし、Nvidiaでは、ワープシャッフルを使用して「タイリング」の2番目のレイヤーを追加します。ワープシャッフルは、レジスタストレージを隣接パイプラインと効果的に共有するため、メモリの依存関係が減少し、パフォーマンスが向上します。しかし、それはCUDAだけです。 OpenCLは、パフォーマンス向上の可能性をトレードすることにより、プラットフォームに依存しません。

回答

AMDは現在、2〜64CPUコアのプロセッサを販売しています。さまざまなAMDCPU / APU(APUはAMDが統合グラフィックスを備えたCPUと呼んでいるもの)の製品ラインとシリーズ、および対応するコア数のリストです。

これらの製品ラインにはそれぞれいくつかの異なるものが含まれていることに注意してください。 CPUの世代および特定のモデルまたは「SKU」(ストックキーピングユニット)。たとえば、Ryzen 71700は両方とも8コアのRyzen7 CPUであるにもかかわらず、Ryzen 73700Xよりも低速です。

Aシリーズ(古くて非効率的な「ブルドーザー」アーキテクチャ上に構築された低電力APU。通常は購入する価値がありません):

  • A4-2コア
  • A6-2コア
  • A8-4コア
  • A9-2コア
  • A10-4コア
  • A12-4コア

Athlon Xシリーズ(Aシリーズと同様ですが、グラフィックはありません。購入しないでください。)

  • AthlonX2-2コア
  • Athlon X4 -4コア

FXシリーズ(「ブルドーザー」CPU Aシリーズに似ていますが、グラフィックが統合されておらず、少し高速です。十分に冷却するのが困難です。通常は購入する価値がありません)

  • FX4xxx-4コア
  • FX6xxx-6コア
  • FX8xxx-8コア
  • FX 9xxx- 8コア

Athlon Gシリーズ(優れた統合グラフィックスを備えた最新の「Zen」アーキテクチャに基づいて構築された安価なAPU。各コアは2つのブルドーザーコアよりもはるかに高速であるため、優れたローエンドオプション)

  • (すべてのバリアント)-2コア

Ryzenシリーズ(ミッドレンジからハイエンドの「Zen」CPU、高いマルチコアパフォーマンス。強力な統合グラフィックスを備えたAPUも含まれています-モデル名が「G」で終わるもの)

  • Ryzen 3-4コア
  • Ryzen 5〜6コア(APUの場合は4コア)
  • Ryzen 7〜8コア
  • Ryzen 9〜12または16コア
  • Ryzen Threadripper-8〜64コア(ハイエンドワークステーションPC向け)

EPYCシリーズ(サーバーおよびHPC /スーパーコンピューターの「Zen」CPU。デスクトップでは使用できますが、使用できません。対象)

  • EPYC-8〜64コア

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です