Kuinka vertailla oikein AMD-virtaprosessoreita ja NVIDIA CUDA -ydimiä

Paras vastaus

AMD on lisännyt painoa ketjutason rinnakkaisuuteen. Se tukee 40 säiettä lennon aikana yhtä GPU: n putkijohtoa kohti.

Nvidia on keskittynyt parempaan välimuistin suorituskykyyn ja langankierteen viestintään. Voit esimerkiksi lähettää dataa putki-1: stä putki-2: een suoraan yhdessä syklissä käyttämällä loimi-sekoitusohjeita. Jos haluat lähettää tietoja pipeline-1: stä pipeline-1024: een, sinun on käytettävä välimuistia / jaettua muistia, joka on myös nopeampi kuin Amd-vastine.

Oikean vertailuarvon tekemiseksi haluaisin

lisää AMD GPU: lle lähetettyjen työkohteiden määrää, jotta ne täyttävät sen putkistot kokonaan.
optimoi loimi-sekoituksilla jne. Nvidialle.

Suora laitteistovertailu, jokainen GPU-sarja on otettava huomioon, ja se olisi hyvin monimutkainen vertailu moniin paperilla oleviin asioihin. Paras tapa tietää suorituskyky on vertailuanalyysi.

Jos esimerkiksi on olemassa N-rungon galaksisimulaation vertailuarvo, minulla olisi useita säikeitä massaa kohden AMD: ssä ja yksi säie / massa Nvidiassa. Sitten optimoisin molemmat käyttämällä ”vierekkäin” nopeaa jaettua muistia. Mutta Nvidiaan lisän toisen kerroksen ”laatoitusta” loimien sekoituksia käyttäen. Loimi-sekoitukset jakavat rekisteritilan tehokkaasti naapuriputkistojen kanssa, joten muistiriippuvuus vähenee ja suorituskyky kasvaa. Mutta se on vain CUDA. OpenCL ei ole riippuvainen alustasta kaupankäynnin avulla jonkin verran suorituskyvyn kasvupotentiaalia.

Vastaus

AMD myy tällä hetkellä suorittimia, joissa on mitä tahansa 2-64 suorittimen ydintä. Tässä on luettelo erilaisista AMD-suorittimista (APU: t, joita AMD kutsuu suorittimiksi integroidulla grafiikalla) tuotelinjoista ja -sarjoista sekä niiden ytimien määrästä.

Huomaa, että jokainen näistä tuotelinjoista sisältää useita erilaisia sukupolvet ja tietyt CPU-mallit tai ”SKU: t” (Stock Keeping Units), joten esimerkiksi Ryzen 7 1700 on hitaampi kuin Ryzen 7 3700X, vaikka ne molemmat ovatkin 8-ytimiisiä Ryzen 7 -prosessoreita:

A-sarja (vähän virtaa käyttävät APU: t, jotka on rakennettu vanhentuneisiin ja tehottomiin puskutraktoriarkkitehtuureihin. Yleensä ei kannata ostaa):

A4 – 2 ydintä
A6 – 2 ytimet
A8 – 4 ydintä
A9 – 2 ydintä
A10 – 4 ydintä
A12 – 4 ydintä

Athlon X -sarja (kuten A-sarja, mutta ilman grafiikkaa. Älä osta.)

Athlon X2 – 2 ydintä
Athlon X4 – 4 ydintä

FX-sarja (”puskutraktori” -prosessorit, samanlainen kuin A-sarja, mutta ilman integroitua grafiikkaa ja hieman nopeampi. Vaikea jäähtyä riittävästi. Ei yleensä kannata ostaa )

FX 4xxx – 4 ydintä
FX 6xxx – 6 ydintä
FX 8xxx – 8 ydintä
FX 9xxx – 8 ydintä

Athlon G -sarja (halvat APU: t, jotka on rakennettu moderneille Zen-arkkitehtuureille ja hyvällä integroidulla grafiikalla. Hyvä edullinen vaihtoehto, koska jokainen ydin on paljon nopeampi kuin kaksi puskutraktoriytintä)

(kaikki vaihtoehdot) – 2 ydintä

Ryzen-sarja (keskitasosta huippuluokan ”Zen” -prosessoreihin, korkealla moniytimisellä suorituskyvyllä. Sisältää myös joitain tehokkaalla integroidulla grafiikalla varustettuja APU-laitteita – mallinimellä G päättyvät)

Ryzen 3 – 4 ytimet
Ryzen 5 – 6 ydintä (4 ydintä APU: ille)
Ryzen 7 – 8 ydintä
Ryzen 9 – 12 tai 16 ydintä
Ryzen Threadripper – 8-64 ydintä (tarkoitettu huippuluokan työasematietokoneille)

EPYC-sarja (palvelin ja HPC / supertietokoneen ”Zen” -prosessorit. Voidaan käyttää työasemissa, mutta ei tarkoitettu sille)

EPYC – 8-64 ydintä

Paras vastaus

Vastaus

Vastaa Peruuta vastaus