AMDストリームプロセッサとNVIDIACUDAコアを適切に比較する方法

ベストアンサー

AMDは、スレッドレベルの並列処理を重視しています。 GPUのパイプラインごとに実行中の40スレッドをサポートします。

Nvidiaは、キャッシュパフォーマンスとスレッドスレッド通信の向上に重点を置いています。たとえば、ワープシャッフル命令を使用して、パイプライン1からパイプライン2に1サイクルで直接データを送信できます。パイプライン1からパイプライン1024にデータを送信する場合は、キャッシュ/共有メモリを使用する必要があります。これは、Amdの対応するメモリよりも高速です。

公正なベンチマークを作成するには、

AMD GPUに送信されるワークアイテムの数を増やして、パイプラインを完全に満たすようにします
Nvidiaのワープシャッフルなどで最適化します。

ハードウェアを直接比較するには、GPUのすべてのシリーズを考慮する必要があり、紙の多くのものとの非常に複雑な比較になります。パフォーマンスを知る最良の方法はベンチマークです。

たとえば、N体銀河シミュレーションのベンチマークがある場合、AMDでは質量あたり複数のスレッドがあり、Nvidiaでは質量あたり1つのスレッドがあります。次に、高速共有メモリで「タイリング」を使用して両方を最適化します。しかし、Nvidiaでは、ワープシャッフルを使用して「タイリング」の2番目のレイヤーを追加します。ワープシャッフルは、レジスタストレージを隣接パイプラインと効果的に共有するため、メモリの依存関係が減少し、パフォーマンスが向上します。しかし、それはCUDAだけです。 OpenCLは、パフォーマンス向上の可能性をトレードすることにより、プラットフォームに依存しません。

回答

AMDは現在、2〜64CPUコアのプロセッサを販売しています。さまざまなAMDCPU / APU（APUはAMDが統合グラフィックスを備えたCPUと呼んでいるもの）の製品ラインとシリーズ、および対応するコア数のリストです。

これらの製品ラインにはそれぞれいくつかの異なるものが含まれていることに注意してください。 CPUの世代および特定のモデルまたは「SKU」（ストックキーピングユニット）。たとえば、Ryzen 71700は両方とも8コアのRyzen7 CPUであるにもかかわらず、Ryzen 73700Xよりも低速です。

Aシリーズ（古くて非効率的な「ブルドーザー」アーキテクチャ上に構築された低電力APU。通常は購入する価値がありません）：

A4-2コア
A6-2コア
A8-4コア
A9-2コア
A10-4コア
A12-4コア

Athlon Xシリーズ（Aシリーズと同様ですが、グラフィックはありません。購入しないでください。）

AthlonX2-2コア
Athlon X4 -4コア

FXシリーズ（「ブルドーザー」CPU Aシリーズに似ていますが、グラフィックが統合されておらず、少し高速です。十分に冷却するのが困難です。通常は購入する価値がありません）

FX4xxx-4コア
FX6xxx-6コア
FX8xxx-8コア
FX 9xxx- 8コア

Athlon Gシリーズ（優れた統合グラフィックスを備えた最新の「Zen」アーキテクチャに基づいて構築された安価なAPU。各コアは2つのブルドーザーコアよりもはるかに高速であるため、優れたローエンドオプション）

（すべてのバリアント）-2コア

Ryzenシリーズ（ミッドレンジからハイエンドの「Zen」CPU、高いマルチコアパフォーマンス。強力な統合グラフィックスを備えたAPUも含まれています-モデル名が「G」で終わるもの）

Ryzen 3-4コア
Ryzen 5〜6コア（APUの場合は4コア）
Ryzen 7〜8コア
Ryzen 9〜12または16コア
Ryzen Threadripper-8〜64コア（ハイエンドワークステーションPC向け）

EPYCシリーズ（サーバーおよびHPC /スーパーコンピューターの「Zen」CPU。デスクトップでは使用できますが、使用できません。対象）

EPYC-8〜64コア

ベストアンサー

回答

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル