Kuinka vertailla oikein AMD-virtaprosessoreita ja NVIDIA CUDA -ydimiä


Paras vastaus

AMD on lisännyt painoa ketjutason rinnakkaisuuteen. Se tukee 40 säiettä lennon aikana yhtä GPU: n putkijohtoa kohti.

Nvidia on keskittynyt parempaan välimuistin suorituskykyyn ja langankierteen viestintään. Voit esimerkiksi lähettää dataa putki-1: stä putki-2: een suoraan yhdessä syklissä käyttämällä loimi-sekoitusohjeita. Jos haluat lähettää tietoja pipeline-1: stä pipeline-1024: een, sinun on käytettävä välimuistia / jaettua muistia, joka on myös nopeampi kuin Amd-vastine.

Oikean vertailuarvon tekemiseksi haluaisin

  • lisää AMD GPU: lle lähetettyjen työkohteiden määrää, jotta ne täyttävät sen putkistot kokonaan.
  • optimoi loimi-sekoituksilla jne. Nvidialle.

Suora laitteistovertailu, jokainen GPU-sarja on otettava huomioon, ja se olisi hyvin monimutkainen vertailu moniin paperilla oleviin asioihin. Paras tapa tietää suorituskyky on vertailuanalyysi.

Jos esimerkiksi on olemassa N-rungon galaksisimulaation vertailuarvo, minulla olisi useita säikeitä massaa kohden AMD: ssä ja yksi säie / massa Nvidiassa. Sitten optimoisin molemmat käyttämällä ”vierekkäin” nopeaa jaettua muistia. Mutta Nvidiaan lisän toisen kerroksen ”laatoitusta” loimien sekoituksia käyttäen. Loimi-sekoitukset jakavat rekisteritilan tehokkaasti naapuriputkistojen kanssa, joten muistiriippuvuus vähenee ja suorituskyky kasvaa. Mutta se on vain CUDA. OpenCL ei ole riippuvainen alustasta kaupankäynnin avulla jonkin verran suorituskyvyn kasvupotentiaalia.

Vastaus

AMD myy tällä hetkellä suorittimia, joissa on mitä tahansa 2-64 suorittimen ydintä. Tässä on luettelo erilaisista AMD-suorittimista (APU: t, joita AMD kutsuu suorittimiksi integroidulla grafiikalla) tuotelinjoista ja -sarjoista sekä niiden ytimien määrästä.

Huomaa, että jokainen näistä tuotelinjoista sisältää useita erilaisia sukupolvet ja tietyt CPU-mallit tai ”SKU: t” (Stock Keeping Units), joten esimerkiksi Ryzen 7 1700 on hitaampi kuin Ryzen 7 3700X, vaikka ne molemmat ovatkin 8-ytimiisiä Ryzen 7 -prosessoreita:

A-sarja (vähän virtaa käyttävät APU: t, jotka on rakennettu vanhentuneisiin ja tehottomiin puskutraktoriarkkitehtuureihin. Yleensä ei kannata ostaa):

  • A4 – 2 ydintä
  • A6 – 2 ytimet
  • A8 – 4 ydintä
  • A9 – 2 ydintä
  • A10 – 4 ydintä
  • A12 – 4 ydintä

Athlon X -sarja (kuten A-sarja, mutta ilman grafiikkaa. Älä osta.)

  • Athlon X2 – 2 ydintä
  • Athlon X4 – 4 ydintä

FX-sarja (”puskutraktori” -prosessorit, samanlainen kuin A-sarja, mutta ilman integroitua grafiikkaa ja hieman nopeampi. Vaikea jäähtyä riittävästi. Ei yleensä kannata ostaa )

  • FX 4xxx – 4 ydintä
  • FX 6xxx – 6 ydintä
  • FX 8xxx – 8 ydintä
  • FX 9xxx – 8 ydintä

Athlon G -sarja (halvat APU: t, jotka on rakennettu moderneille Zen-arkkitehtuureille ja hyvällä integroidulla grafiikalla. Hyvä edullinen vaihtoehto, koska jokainen ydin on paljon nopeampi kuin kaksi puskutraktoriytintä)

  • (kaikki vaihtoehdot) – 2 ydintä

Ryzen-sarja (keskitasosta huippuluokan ”Zen” -prosessoreihin, korkealla moniytimisellä suorituskyvyllä. Sisältää myös joitain tehokkaalla integroidulla grafiikalla varustettuja APU-laitteita – mallinimellä G päättyvät)

  • Ryzen 3 – 4 ytimet
  • Ryzen 5 – 6 ydintä (4 ydintä APU: ille)
  • Ryzen 7 – 8 ydintä
  • Ryzen 9 – 12 tai 16 ydintä
  • Ryzen Threadripper – 8-64 ydintä (tarkoitettu huippuluokan työasematietokoneille)

EPYC-sarja (palvelin ja HPC / supertietokoneen ”Zen” -prosessorit. Voidaan käyttää työasemissa, mutta ei tarkoitettu sille)

  • EPYC – 8-64 ydintä

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *