Az AMD Stream processzorok és az NVIDIA CUDA magok megfelelő összehasonlítása


Legjobb válasz

Az AMD nagyobb súlyt helyezett a szálszintű párhuzamosságra. 40 szálat támogat repülés közben a GPU csővezetékénként.

Az Nvidia a gyorsítótár jobb teljesítményére és a szál-szál kommunikációra összpontosított. Például, az 1-es csővezetékből a 2-es csővezetékbe adatokat küldhet közvetlenül 1 ciklusban, a lánc keverés utasításával. Ha adatokat szeretne küldeni az 1-es pipeline-ről az 1024-es pipeline-re, akkor a gyorsítótárat / megosztott memóriát kell használnia, amely szintén gyorsabb, mint az Amd megfelelője.

Egy korrekt benchmark elkészítéséhez

  • növelje az AMD GPU-ra küldött munkaelemek számát, hogy azok teljes mértékben kitöltsék a csővezetékeket.
  • optimalizáljon láncfoszlányokkal stb. az Nvidia számára.

közvetlen hardver-összehasonlítás, a GPU-k minden sorozatát figyelembe kell venni, és ez nagyon összetett összehasonlítás lenne sok papíron szereplő dologgal. A teljesítmény megismerésének legjobb módja a benchmarking.

Például, ha van N-testes galaxis-szimulációs benchmark, akkor AMD-nként tömegenként több szál, Nvidia-ban pedig 1 szál / tömeg lenne. Akkor optimalizálnám mindkettőt a „csempézés” használatával a gyors megosztott memórián. De az Nvidia-ra egy második réteg „csempézést” adnék hozzá, lánc keverésekkel. A Warp-keverések hatékonyan osztják meg a regisztertárakat a szomszédos csővezetékekkel, így csökken a memóriafüggőség és nő a teljesítmény. De ez csak a CUDA. Az OpenCL nem platformfüggő, ha valamilyen teljesítménynövekedési potenciált forgalmaz.

Válasz

Az AMD jelenleg 2-64 processzormaggal rendelkező processzorokat árul. Itt van egy lista a különféle AMD CPU / APU-król (az APU-k az AMD-nek hívják az integrált grafikával rendelkező CPU-kat) termékvonalaknak és sorozatoknak, valamint azok megfelelő magszámának.

Ne feledje, hogy ezek a termékvonalak mindegyike több különböző generációk és a CPU meghatározott modelljei vagy „SKU-jai” (készletmegőrző egységek), így például egy Ryzen 7 1700 lassabb, mint egy Ryzen 7 3700X, bár mindkettő 8 magos Ryzen 7 CPU:

A sorozat (alacsony teljesítményű APU-k, amelyek elavult és nem hatékony „buldózer” architektúrákra épülnek. Általában nem érdemes megvenni):

  • A4 – 2 mag
  • A6 – 2 mag
  • A8 – 4 mag
  • A9 – 2 mag
  • A10 – 4 mag
  • A12 – 4 mag

Athlon X sorozat (mint az A-sorozat, de a grafika nélkül. Ne vásároljon.)

  • Athlon X2 – 2 mag
  • Athlon X4 – 4 mag

FX-sorozat („bulldózer” CPU-k, hasonlóak az A-sorozathoz, de integrált grafika nélkül, és valamivel gyorsabb. Nehéz kellően hűlni. Általában nem érdemes megvenni )

  • FX 4xxx – 4 mag
  • FX 6xxx – 6 mag
  • FX 8xxx – 8 mag
  • FX 9xxx – 8 mag

Athlon G sorozat (olcsó APU-k, modern „Zen” architektúrákra épülve, jó integrált grafikával. Jó alacsony kategóriás lehetőség, mivel mindegyik mag sokkal gyorsabb, mint két buldózer mag)

  • (minden változat) – 2 mag

Ryzen sorozat (közepes és csúcskategóriás „Zen” CPU-k, nagy többmagos teljesítmény mellett. Néhány erős integrált grafikával rendelkező APU-t is tartalmaz – azokat, amelyeknek a modell neve „G” végződik)

  • Ryzen 3 – 4 Ryzen 5 – 6 mag (4 mag APU-khoz)
  • Ryzen 7 – 8 mag
  • Ryzen 9 – 12 vagy 16 mag
  • Ryzen Threadripper – 8–64 mag (csúcskategóriás munkaállomás-PC-k számára készült)

EPYC sorozat (szerver és HPC / szuperszámítógép „Zen” CPU-k. Használható asztali számítógépeken, de nem szánták neki)

  • EPYC – 8–64 mag

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük