Skrivet av pv2b:
Absolut, och för lite perspektiv:
På jobbet roddar jag bl.a. en virtualiseringsmiljö. Den miljön har 4 servrar (kan inte vara färre av operativa skäl, bl.a. måste miljön kunna tolerera att en server går ner eller tas ner för underhåll). I varje server sitter 2 st Intel Xeon Gold 6240 (18C/36T) för totalt 36 kärnor per server. (Jag hade hellre sett Epyc i denna lösning, men det var inte möjligt av olika anledningar som är för tråkiga att gå in på) och 384 GB RAM. På denna lösning har vi över 100 virtuella maskiner. Antalet CPU-kärnor är dessutom medvetet överspecificerat, så att vi har ett enkelt sätt att uppgradera lösningens kapacitet bara genom att stoppa in mer RAM.
Maskinen som du specat upp är för stor för att vi skulle kunna använda den, men visst, hade vi vart större (än vår lilla relativa fjuttmiljö på cirka 100 lätt belastade virtuella maskiner) så hade den klart kunnat vara intressant.
Fast belysering inte ditt exempel just vad problemet med HEDT för det use-case:et är?
Huvudorsaken till att virtualisering blivit så framgångsrikt är att många servers hade rätt lång nyttjandegrad hos både I/O men framförallt CPU-last, man kunde slå ihop flera fysiska server på en enda m.h.a. virtualisering utan prestandaförlust. I många fall kunde man till och med få prestandaförbättring om servern man flyttade till hade högre peak-prestanda (just detta har hållit Xeon relevant mot Epyc, Intel har fortfarande högre peak-prestanda).
HEDT har i.o.f.s. ofta ännu högre peak-prestanda än servers, problemet är att även fast de virtuella instanserna ofta drar lite CPU-kraft behöver de fortfarande få plats i RAM. Och här ligger den stora vattendelaren mellan "riktiga" servers och HEDT: i teorin kan TRX40 stödja upp till 1 TB, i praktiken (d.v.s. givet vilka DIMM:ar som faktiskt kan köpas då TRX40 använder UDIMM) är gränsen sist jag kollade 256 MB (största UDIMM som tillverkades sist jag kollade var 32 GB). Intel har samma begränsing på deras HEDT-plattform m.a.p. RAM.
Servers kan, lite beroende på modell, stödja 768 GB till 2 TB RAM per sockel, vilket gör "riktiga" server CPUer långt vettigare för just virtualisering. Er setup stödjer totalt 2 TB RAM, 1 TB per sockel.
Då 3950X/5950X tagit konsumentledet till 16C/32T blir HEDT väldigt nischat, i princip handlar det om fall där man behöver väldigt mycket I/O-kapacitet, inte speciellt mycket RAM och kör applikationer som skalar väldigt bra med CPU-kärnor samtidigt som det handlar om problem som skalar bra i form av uppgiftsparallellism med hög divergens. Handlar det om dataparallelism eller uppgiftsparallellism med låg divergens är GPGPU lång vettigare (eller möjligen SIMD på CPU).
Skrivet av Levandebild:
TRX80 är väl tänkt till nästa vända med DDR5?
Är inte enda egentliga skillnaden mellan dessa två socklar att TRX40 har 4 st DDR4 minneskanaler medan TRX80 skulle, likt Epyc, få 8 st DDR4 minneskanaler.
Finns ju både en 3990X för TRX40 samt vad som ser ut att vara exakt samma CPU för TRX80, 3995WX. Båda har 64C/128T men 3995WX har 8 minneskanaler
Skrivet av sombrer0:
CFD-simuleringar är ett bra exempel.
Generellt brukar minnesbandbredden flaska vid ca 3 kärnor /minneskanal beroende på arbetet samt hur snabb varje kärna är.
CFD är kanske professionellt/akademiskt scenario, men jag kör gärna mindre simuleringar på hemmadatorn för att det är kul.
Kan tänka mig att FEM-simuleringar har liknande CPU-belastning.
Fall som är begränsade av bandbredd mot RAM är ofta en typ som kan få rejäl boost från GPGPU. Har inte jobbat med varken CDF- eller FEM-simulering, sökningar på dessa får rätt mycket träffar på CUDA där i alla fall vissa fall verkar se rätt rejäla prestandavinster.
För just CDF har Nvidia en rad exempel på hur CUDA används.
Mängden VRAM kan självklart vara en flaskhals, men redan konsumentkort har idag möjlighet till totalt 48 GB VRAM (två stycken 3090 med NVLink, sedan Volta kan kort ihopkopplade via NVLink använda varandras VRAM).
Skrivet av skewgen:
Det stämmer, jag kör FEM en hel del och man ser väldigt likt beteende. Därav jag var säker på att det fanns tillämpningar där denna processor inte skulle vara så dum
Se ovan, du kanske har lite mer insikt kring FEM och GPGPU. Även för FEM finns en hel del diskussion och presentationer från 2011 och framåt, men är inte fullt lika mycket som CDF (vilket jag inte vet vad det beror på, kan ju vara att CDF är mer utbrett eller att FEM passar sämre för GPGPU).
Finns ju lite korta video-exempel på vad som kan göras i (nära) realtid på konsumentkort relaterat till detta