AMD Threadripper "Genesis Peak" kan börja från 16 kärnor

Permalänk
Medlem
Skrivet av Oegat:

... såvida de inte sätter dit 4st CCD med 4 kärnor i varje. Jag gissar att om den får samma struktur som 5950X (2st CCD) så blir det samma cachemängd också.

Jag tycker det verkar mest logiskt att använda fyra chiplets: Ger både bättre möjlighet till utökad binning och ökad differentiering gentemot Ryzen.

Permalänk
Datavetare
Skrivet av pv2b:

Absolut, och för lite perspektiv:

På jobbet roddar jag bl.a. en virtualiseringsmiljö. Den miljön har 4 servrar (kan inte vara färre av operativa skäl, bl.a. måste miljön kunna tolerera att en server går ner eller tas ner för underhåll). I varje server sitter 2 st Intel Xeon Gold 6240 (18C/36T) för totalt 36 kärnor per server. (Jag hade hellre sett Epyc i denna lösning, men det var inte möjligt av olika anledningar som är för tråkiga att gå in på) och 384 GB RAM. På denna lösning har vi över 100 virtuella maskiner. Antalet CPU-kärnor är dessutom medvetet överspecificerat, så att vi har ett enkelt sätt att uppgradera lösningens kapacitet bara genom att stoppa in mer RAM.

Maskinen som du specat upp är för stor för att vi skulle kunna använda den, men visst, hade vi vart större (än vår lilla relativa fjuttmiljö på cirka 100 lätt belastade virtuella maskiner) så hade den klart kunnat vara intressant.

Fast belysering inte ditt exempel just vad problemet med HEDT för det use-case:et är?

Huvudorsaken till att virtualisering blivit så framgångsrikt är att många servers hade rätt lång nyttjandegrad hos både I/O men framförallt CPU-last, man kunde slå ihop flera fysiska server på en enda m.h.a. virtualisering utan prestandaförlust. I många fall kunde man till och med få prestandaförbättring om servern man flyttade till hade högre peak-prestanda (just detta har hållit Xeon relevant mot Epyc, Intel har fortfarande högre peak-prestanda).

HEDT har i.o.f.s. ofta ännu högre peak-prestanda än servers, problemet är att även fast de virtuella instanserna ofta drar lite CPU-kraft behöver de fortfarande få plats i RAM. Och här ligger den stora vattendelaren mellan "riktiga" servers och HEDT: i teorin kan TRX40 stödja upp till 1 TB, i praktiken (d.v.s. givet vilka DIMM:ar som faktiskt kan köpas då TRX40 använder UDIMM) är gränsen sist jag kollade 256 MB (största UDIMM som tillverkades sist jag kollade var 32 GB). Intel har samma begränsing på deras HEDT-plattform m.a.p. RAM.

Servers kan, lite beroende på modell, stödja 768 GB till 2 TB RAM per sockel, vilket gör "riktiga" server CPUer långt vettigare för just virtualisering. Er setup stödjer totalt 2 TB RAM, 1 TB per sockel.

Då 3950X/5950X tagit konsumentledet till 16C/32T blir HEDT väldigt nischat, i princip handlar det om fall där man behöver väldigt mycket I/O-kapacitet, inte speciellt mycket RAM och kör applikationer som skalar väldigt bra med CPU-kärnor samtidigt som det handlar om problem som skalar bra i form av uppgiftsparallellism med hög divergens. Handlar det om dataparallelism eller uppgiftsparallellism med låg divergens är GPGPU lång vettigare (eller möjligen SIMD på CPU).

Skrivet av Levandebild:

TRX80 är väl tänkt till nästa vända med DDR5?

Är inte enda egentliga skillnaden mellan dessa två socklar att TRX40 har 4 st DDR4 minneskanaler medan TRX80 skulle, likt Epyc, få 8 st DDR4 minneskanaler.

Finns ju både en 3990X för TRX40 samt vad som ser ut att vara exakt samma CPU för TRX80, 3995WX. Båda har 64C/128T men 3995WX har 8 minneskanaler

Skrivet av sombrer0:

CFD-simuleringar är ett bra exempel.
Generellt brukar minnesbandbredden flaska vid ca 3 kärnor /minneskanal beroende på arbetet samt hur snabb varje kärna är.
CFD är kanske professionellt/akademiskt scenario, men jag kör gärna mindre simuleringar på hemmadatorn för att det är kul.
Kan tänka mig att FEM-simuleringar har liknande CPU-belastning.

Fall som är begränsade av bandbredd mot RAM är ofta en typ som kan få rejäl boost från GPGPU. Har inte jobbat med varken CDF- eller FEM-simulering, sökningar på dessa får rätt mycket träffar på CUDA där i alla fall vissa fall verkar se rätt rejäla prestandavinster.

För just CDF har Nvidia en rad exempel på hur CUDA används.

Mängden VRAM kan självklart vara en flaskhals, men redan konsumentkort har idag möjlighet till totalt 48 GB VRAM (två stycken 3090 med NVLink, sedan Volta kan kort ihopkopplade via NVLink använda varandras VRAM).

Skrivet av skewgen:

Det stämmer, jag kör FEM en hel del och man ser väldigt likt beteende. Därav jag var säker på att det fanns tillämpningar där denna processor inte skulle vara så dum

Se ovan, du kanske har lite mer insikt kring FEM och GPGPU. Även för FEM finns en hel del diskussion och presentationer från 2011 och framåt, men är inte fullt lika mycket som CDF (vilket jag inte vet vad det beror på, kan ju vara att CDF är mer utbrett eller att FEM passar sämre för GPGPU).

Finns ju lite korta video-exempel på vad som kan göras i (nära) realtid på konsumentkort relaterat till detta
Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Olle P:

Jag tycker det verkar mest logiskt att använda fyra chiplets: Ger både bättre möjlighet till utökad binning och ökad differentiering gentemot Ryzen.

Ja, håller med dig. Det vore rena drömmen om det gick att skapa en 16-core som har 4st 4c-chiplets och 128MB L3 cache.

Jag tror och hoppas att det är sant att de släpper en 16c-modell. Det finns gott om tillämpningar där antalet kärnor inte är det primära, men minnesprestanda och I/O är allt. Epyc, javisst, de är toppen, men har för låga klockfrekvenser för arbetsstationer. Epyc är dessutom inte kompatibel med TRX40-mobos, vilket är en stor nackdel, då det finns väldigt få moderkort som stöder Epyc på den öppna marknaden.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem
Skrivet av Yoshman:

Se ovan, du kanske har lite mer insikt kring FEM och GPGPU. Även för FEM finns en hel del diskussion och presentationer från 2011 och framåt, men är inte fullt lika mycket som CDF (vilket jag inte vet vad det beror på, kan ju vara att CDF är mer utbrett eller att FEM passar sämre för GPGPU).

Jag är inte säker på anledningen, har till och med frågat om GPU acceleration men enligt de FEM leverantörer jag pratat med är vinsten ofta inte värt utvecklingstiden och GPGPU bara extremt bra i vissa specialfall.

Jag kan tänka mig att det beror på två saker främst:
- Extremanvändare har ofta tillgång till kluster och specialbyggda system för ändamålet.
- Mycket blir i slutändan minnesbegränsat (minnet tar slut) och det är både billigare och enklare att uppgradera minne med CPU.
- Vissa solvers kanske helt enkelt inte passar så bra för GPGPU (har hört att det bara passar vissa som ganska sällan är de bästa att använda).

Tror att CFD ligger längre fram vad gäller GPGPU än FEM.

Permalänk
Medlem
Skrivet av Jygge:

Sitter med första versionen av Threadripper 12 känor är kanon nöjd med den...

Håller med. Sitter med 16 Kärnors versionen av första gen. Threadripper. Ett absolut monster, jag hade tur och vann silikon lotteriet med, den iddlar på 26c, och jag kunde pressa 4.7 GHz ur den utan att den svettas. Samma motherboard som det du har.

Finns noll flaskhals när jag kör 3090 OC kortet med den, det bara drönar på i alla moderna spel

Permalänk
Hedersmedlem
Skrivet av JoOngle:

Håller med. Sitter med 16 Kärnors versionen av första gen. Threadripper. Ett absolut monster, jag hade tur och vann silikon lotteriet med, den iddlar på 26c, och jag kunde pressa 4.7 GHz ur den utan att den svettas. Samma motherboard som det du har.

Finns noll flaskhals när jag kör 3090 OC kortet med den, det bara drönar på i alla moderna spel

Första gen, dvs 1950X? De brukar väl sällan nå över c:a 4.0-4.1 GHz...?

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
Mobil: Moto G200

Permalänk
Medlem
Skrivet av Yoshman:

Är inte enda egentliga skillnaden mellan dessa två socklar att TRX40 har 4 st DDR4 minneskanaler medan TRX80 skulle, likt Epyc, få 8 st DDR4 minneskanaler.

Finns ju både en 3990X för TRX40 samt vad som ser ut att vara exakt samma CPU för TRX80, 3995WX. Båda har 64C/128T men 3995WX har 8 minneskanaler

Är inte dessa i sådana fall redan i bruk hos Lenevo som har tidsexklusivitet fram till nu i vår?

Permalänk
Medlem
Skrivet av JoOngle:

Håller med. Sitter med 16 Kärnors versionen av första gen. Threadripper. Ett absolut monster, jag hade tur och vann silikon lotteriet med, den iddlar på 26c, och jag kunde pressa 4.7 GHz ur den utan att den svettas. Samma motherboard som det du har.

Finns noll flaskhals när jag kör 3090 OC kortet med den, det bara drönar på i alla moderna spel

Inte illa. Min ligger på 4.19 Ghz ej överklockad har bara valt att jag har vattenkyld i bios... Inte illa.

Visa signatur

Låda thermaltake view 91 M-kort ASUS X399 ROG Zenith Extreme CPU AMD Ryzen Threadripper 1920X 3.5 GHz Kylning Hemma byggd vattenkylning 2 x 480mm + 1 x 420mm radiatorer Minne 8 X 16Gb DDR4 HD SSD 240GB OCZ Trion 100 Grafik Gigabyte Geforce RTX 3080 10GB GAMING OC WATERFORCE WB AGG Corsair RM 1000w 80+ Gold Skärm ASUS 43" ROG Strix XG438QR 4K VA HDR 120 Hz

Permalänk
Medlem

Varför sänka tröskeln när man redan har datorvärldens mest prisvärda processor 3990X?

Visa signatur

CPU: Intel i9-12900K Cooler: Asus TUF Gaming LC 240 ARGB MB: Asus TUF Gaming Z690 Plus Wifi D4 GPU: Asus TUF GeForce RTX 3080 Ti 12GB Case: In Win D-Frame HD: Intel Optane 900P 280GB, WD Black SN850 1TB Mem: Kingston Fury Beast RGB 3600MHz CL17 32GB PSU: Corsair AX760 OS: Win11 Pro

Permalänk
Medlem
Skrivet av Olle P:

Jag tycker det verkar mest logiskt att använda fyra chiplets: Ger både bättre möjlighet till utökad binning och ökad differentiering gentemot Ryzen.

Ja det finns en logik i det, absolut. Om det blir en "fullstor" serie så kommer vi garanterat att få se quad-CCD modeller. En modell med 4x4 kärnor skulle kanske kunna säljas lite dyrare också pga mer cache. Men då får den ju mer av den komplexiteten som annars kännetecknat Ryzen. Jag vet dock inte hur stora flaskhalsar man får nuförtiden av partitionerad cache, AMD har ju jobbat en hel del på det sen första generationen Ryzen. Själv är jag nog mer intresserad om det blir samma layout som 5950 med 2xCCD, trots mindre cache, föredrar när det är enkelt. Det hindrar såklart inte större designer för modeller med > 16 kärnor. Men vi får se.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Permalänk
Medlem
Skrivet av Dinkefing:

Jo men hur länge räcker 24 pci-e banor när man vill koppla lite gott gott till datorn? Intels konsument modeller hade mesiga 16 banor tills de nu tar steget till 20 iom Rocket Lake men de är fortfarande efter Ryzen.

Sant, jag tänkte enbart på ren cpu prestanda men det är ju därför AMD använder threadripper pro i sitt "riktiga" workstationerbjudande.

Visa signatur

Lian-li PC-011 Dynamic Corsair RM750x ROG STRIX X570-E GAMING 5950X NZXT Kraken Z73 32GB Corsair Dominator 3200MHz Gigabyte 6800XT Master Corsair MP600 1TB + Toshiba NVMe 512GB Vertex Pok3r MX Brown Acer Predator XB323UGX Logitech G502+ & Powerplay ...lagrar gör jag på Synology 920 32TB.