AMD Ryzen Threadripper blir 1900-serien

Permalänk
Datavetare
Skrivet av Pudeln:

Ja precis. Du säger liksom mot dig själv. TR kommer va långsammare än Intels motsvarande i vissa scenarion. Men det spelar liksom väldigt liten roll då TR är betydligt billigare. Och ärligt talat en betydligt roligare plattform att som entusiast bygga.

Intel X299 är en dyr jäspning.

Vad är motsägelse? Finns absolut saker som fungerar lysande på multi-socket system, dessa är just saker som inte kräver någon större mängd kommunikation mellan sockets.

Finns också saker som kan använda många CPU-trådar men fungerar riktigt dåligt över CPU-sockets, detta är t.ex. saker som använder fork-join eller work-stealing och där varje deljobb inte tar superlång tid att utföra (relativt hög latens mellan NUMA-zoner) och där data man jobbar på är relativt stort (relativt låg bandbredd mellan NUMA-zoner).

Som exempel: har man en arbetslast som består av att massor med enkeltrådade uppgifter körs parallellt (t.ex. kompilering) så fungerar det lysande med system som har flera NUMA-noder. Försöker man sortera en stor datamängd parallellt fungerar det uselt att korsa NUMA-noder.

C2Q må ha varit en MCM, men till skillnad från Threadripper (och multi-socket servers) så hade C2Q endast en NUMA-nod per socket. C2Q är mer jämförbar med två CCX i Zen (även om CCX rimligtvis har lägre latens då de är på samma krets), Threadripper är mer jämförbar med ett 2S system.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Threadripper 1998 lät så otroligt dumt så jag är i alla fall glad att det inte blev det. Då hade de lika gärna kunnat kalla den Threadripper XP...

Visa signatur

Ryzen 7 3800X, Asus Prime X370 Pro, 32 GB LPX 3600, Gainward RTX 3060 Ti Ghost, 7 TB SSD + 4 TB HDD

Permalänk
Medlem
Skrivet av xenom:

Funny cuz i's true .. skryta med "quad" memory lanes
-pinsamt!

Skickades från m.sweclockers.com

Vadå x299 kommer juh i vissa fall inte ens ge stöd för quad lanes så visst är det befogat skryt.

Visa signatur

Har en lättare form av dyslexi därav stavning m.m

Permalänk
Hjälpsam
Skrivet av Yoshman:

Vad är motsägelse? Finns absolut saker som fungerar lysande på multi-socket system, dessa är just saker som inte kräver någon större mängd kommunikation mellan sockets.

Finns också saker som kan använda många CPU-trådar men fungerar riktigt dåligt över CPU-sockets, detta är t.ex. saker som använder fork-join eller work-stealing och där varje deljobb inte tar superlång tid att utföra (relativt hög latens mellan NUMA-zoner) och där data man jobbar på är relativt stort (relativt låg bandbredd mellan NUMA-zoner).

Som exempel: har man en arbetslast som består av att massor med enkeltrådade uppgifter körs parallellt (t.ex. kompilering) så fungerar det lysande med system som har flera NUMA-noder. Försöker man sortera en stor datamängd parallellt fungerar det uselt att korsa NUMA-noder.

C2Q må ha varit en MCM, men till skillnad från Threadripper (och multi-socket servers) så hade C2Q endast en NUMA-nod per socket. C2Q är mer jämförbar med två CCX i Zen (även om CCX rimligtvis har lägre latens då de är på samma krets), Threadripper är mer jämförbar med ett 2S system.

Fast där har vi detta med att dela upp ett jobb för många kärnor, den typen av jobb som kräver mycket kommunikation mellan kärnorna kommer vara väldigt besvärliga att tråda ens för åtta kärnor.
Du har ju själv ofta påpekat svårigheter med att tråda.

De jobb som inte kräver mycket kommunikation är typiskt lättare att tråda.

Antingen är jobbet inte speciellt att lätt parallellisera, då kan det exekveras på en nod, eller så är det lätt och då har det sällan mycket kommunikation och fungerar utmärkt på flera.

Tror inte att detta kommer att märkas i praktiken, även om det säkert går att gräva fram något enstaka testprogram där detta märks.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare
Skrivet av Ratatosk:

Fast där har vi detta med att dela upp ett jobb för många kärnor, den typen av jobb som kräver mycket kommunikation mellan kärnorna kommer vara väldigt besvärliga att tråda ens för åtta kärnor.
Du har ju själv ofta påpekat svårigheter med att tråda.

De jobb som inte kräver mycket kommunikation är typiskt lättare att tråda.

Absolut är det så!

Faktum är att om man gräver lite bland CPU-tester mellan 2005-2008, d.v.s. från tiden när konsumentmodeller dual-core först introducerades till dessa att quad-core dök upp så kan man se hur nästan inga applikationer använde flera CPU-kärnor 2005. När quad-core modellerna dök upp skalade t.ex. rendering utan problem från två till fyra kärnor, det då detta problem är trivialt att parallellisera.

Men finns också problem som inte består av N oberoende uppgifter som kan köras på en separat CPU-kärna, fork-join ramverk är idag en standardfunktion i både Java-plattformen och .NET (finns även en rad 3:e parts ramverk till C/C++ för just fork-join). Finns absolut problem som kan skalas rätt rejält långt m.h.a. den tekniken, men finns självklart också fall som i bästa fall fungerar väl till 2-3 kärnor.

Skrivet av Ratatosk:

Antingen är jobbet inte speciellt att lätt parallellisera, då kan det exekveras på en nod, eller så är det lätt och då har det sällan mycket kommunikation och fungerar utmärkt på flera.

Tror inte att detta kommer att märkas i praktiken, även om det säkert går att gräva fram något enstaka testprogram där detta märks.

Och det här är precis det jag med ungefär samma framgång som Don Quijote hade mot väderkvarnarna pekat på kring vilka förväntningar man bör ha på användbarheten av väldigt många CPU-kärnor på skrivbordet. Spel ligger i absolut framkant vad det gäller att dra nytt av flera CPU-kärnor trots ett grundproblem som inte är i närheten "embarrassingly parallel".

Vad vi ser i dag är viss nytta av 6 och ibland även 8 kärnor, men även de spel som skalar bäst med CPU-kärnor har sällan över 50 % skalning när man går från 2C/4T -> 4C/8T och det blir hela tiden svårare att skala bättre ju närmare man kommer den teoretiskt maximala skalningen (som är möjligt att beräkna och den är inte perfekt skalning i detta fall) samt prestandaeffekten av att dubbla antalet CPU-kärnor faller kraftigt med ökande antal CPU-kärnor.

Men finns absolut fall som kan utnyttja många kärnor men som skalar väsentligt sämre över NUMA-noder jämfört med över en monolitisk multicore CPU. Gräver man fram serverbenchmarks för "Magny Cours" ser man t.ex. att relationsdatabaser inte gillade den designen, men vissa typer av NoSQL databaser inte har några problem alls att skala över multisocket system.

Tydligen är ~20-30 % av alla dual-socket servers bara bestyckade med en CPU. Rätt säker att det inte är en prisfråga, sett till TCO blir kostnaden för en CPU rätt marginell för en server. Handlar nog mest om att folk gjort sin hemläxa, de vet att servern i fråga används till något som inte fungerar väl över NUMA-zoner.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Gillar att ni rättade artikeln efter mitt inlägg men ni missade en processor
i7-7980XE ska också vara en i9

"Namnet har likheter med Intels kommande 12-kärniga modell Core i9-7920X, vars syskon med 10, 14, 16 och 18 kärnor heter i9-7900X, i9-7940X, i9-7960X respektive i7-7980XE"

Permalänk
Hjälpsam
Skrivet av I000:

Gillar att ni rättade artikeln efter mitt inlägg men ni missade en processor
i7-7980XE ska också vara en i9

"Namnet har likheter med Intels kommande 12-kärniga modell Core i9-7920X, vars syskon med 10, 14, 16 och 18 kärnor heter i9-7900X, i9-7940X, i9-7960X respektive i7-7980XE"

Du kan skicka rättelser på detta sätt.
#8531794

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |