AMD 스트림 프로세서와 NVIDIA CUDA 코어를 올바르게 비교하는 방법

최상의 답변

AMD는 스레드 수준 병렬성에 더 많은 비중을 두었습니다. GPU 파이프 라인 당 진행중인 40 개의 스레드를 지원합니다.

Nvidia는 더 나은 캐시 성능과 스레드-스레드 통신에 중점을 두었습니다. 예를 들어 워프 셔플 명령을 사용하여 파이프 라인 -1에서 파이프 라인 -2로 데이터를 1 주기로 직접 보낼 수 있습니다. pipeline-1에서 pipeline-1024로 데이터를 전송하려면 Amd보다 빠른 캐시 / 공유 메모리를 사용해야합니다.

공정한 벤치 마크를 만들려면

AMD GPU로 전송되는 작업 항목 수를 늘려 파이프 라인을 완전히 채 웁니다
Nvidia의 워프 셔플 등으로 최적화합니다.

직접적인 하드웨어 비교, 모든 GPU 시리즈를 고려해야하며 종이에있는 많은 것들과 매우 복잡한 비교가 될 것입니다. 성능을 아는 가장 좋은 방법은 벤치마킹입니다.

예를 들어 N- 바디 은하 시뮬레이션 벤치 마크가있는 경우 AMD에서는 질량 당 여러 스레드를, Nvidia에서는 질량 당 스레드 1 개를 사용합니다. 그런 다음 빠른 공유 메모리에서 “타일링”을 사용하여 두 가지를 모두 최적화합니다. 그러나 Nvidia에서는 워프 셔플을 사용하여 두 번째 “타일링”레이어를 추가합니다. 워프 셔플은 레지스터 스토리지를 인접 파이프 라인과 효과적으로 공유하므로 메모리 종속성이 감소하고 성능이 향상됩니다. 그러나 그것은 단지 CUDA입니다. OpenCL은 잠재적 인 성능 향상을 거래함으로써 플랫폼에 의존하지 않습니다.

Answer

AMD는 현재 CPU 코어가 2 ~ 64 개인 프로세서를 판매합니다. 다음은 다양한 AMD CPU / APU (APU는 AMD가 통합 그래픽이있는 CPU라고 부르는 것입니다) 제품 라인 및 시리즈와 해당 코어 수 목록입니다.

각 제품 라인에는 여러 가지가 있습니다. 예를 들어, Ryzen 7 1700은 둘 다 8 코어 Ryzen 7 CPU이지만 Ryzen 7 3700X보다 느립니다.

A- 시리즈 (오래되고 비효율적 인 “불도저”아키텍처에 구축 된 저전력 APU. 일반적으로 구매할 가치가 없음) :

A4-2 코어
A6-2 코어
A8-4 코어
A9-2 코어
A10-4 코어
A12-4 코어

Athlon X 시리즈 (A 시리즈와 같지만 그래픽이 없습니다. 구매하지 마십시오.)

Athlon X2-2 코어
Athlon X4 -4 코어

FX- 시리즈 (“불도저”CPU A- 시리즈와 비슷하지만 통합 그래픽이없고 약간 빠릅니다. 충분히 냉각하기 어렵습니다. 일반적으로 구매할 가치가 없습니다. )

FX 4xxx-4 코어
FX 6xxx-6 코어
FX 8xxx-8 코어
FX 9xxx- 8 코어

Athlon G 시리즈 (훌륭한 통합 그래픽을 갖춘 최신 “Zen”아키텍처에 구축 된 저렴한 APU. 각 코어가 2 개의 불도저 코어보다 훨씬 빠르기 때문에 좋은 저가형 옵션입니다.)

(모든 변형)-2 코어

Ryzen 시리즈 (높은 멀티 코어 성능을 갖춘 미드 레인지에서 하이 엔드 “Zen”CPU. 또한 강력한 통합 그래픽이있는 일부 APU (모델 이름이 “G”로 끝나는 APU 포함) 포함)

Ryzen 3-4 코어
Ryzen 5 ~ 6 코어 (APU의 경우 4 코어)
Ryzen 7 ~ 8 코어
Ryzen 9 ~ 12 또는 16 코어
Ryzen Threadripper-8 ~ 64 코어 (고급 워크 스테이션 PC 용)

EPYC 시리즈 (서버 및 HPC / 슈퍼 컴퓨터“Zen”CPU. 데스크톱에서는 사용할 수 있지만 사용할 수 없음) 의도)

EPYC-8 ~ 64 코어

최상의 답변

Answer

답글 남기기 답글 취소하기