AMD förklarar fyra kretsar hos Ryzen Threadripper

Permalänk
Melding Plague

AMD förklarar fyra kretsar hos Ryzen Threadripper

Hopp om AMD Ryzen Threadripper med 32 kärnor uppstod när Ryzen Threadripper 1950X visades bestå av fyra riktiga kretsar. AMD:s produktchef slår nu hål på förhoppningarna.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk

2 veckor senare "Threadripper låses upp till Epyc"

Visa signatur

Spelburk: R7 5700X | 5700 XT | 32GB RAM | MSI B350M PRO-VDH

Permalänk
Medlem

Det besvarar ju fortfarande inte frågan om en framtida version med fler kärnor är möjlig eller ej.

Det vi fått ett svar på nu rör ju endast om de andra två kärnorna går låsa upp eller inte.

Jag tror och hoppas att vi får se en TR med fler kärnor i framtiden, då naturligtvis med omkonfigurerade infinity fabric-länkar som en naturlig del i det ledet.

Visa signatur

ozzed.net Min egenkomponerade 8-bit musik. Gillar du musiken från gamla klassiska NES eller Gameboy och liknande är det värt ett besök. :) Jag finns också på Spotify, Bandcamp, Jamendo, Youtube, och du kan även följa mig på Twitter och Facebook.
Vet du att du har fel? Signalera detta tydligt med Argumentationsfel och gärna Whataboutism.

Permalänk

Mysko. Varför använder de inte bara 2 kretsar om max är 16 kärnor? De använder ju 4 kärnor, då låter det som att max är 32 kärnor?

Permalänk
Medlem

Jag kan inte påstå att AMDs förklaring övertygade mej, och jag skulle inte bli förvånad om det t ex nästa år dyker upp en Threadripper med just 32 cores. Då får dessa rykten ny fart igen.

Jag ser minst en skärm för mycket ( igen ) av överjävlig övertrötthet, så jag ska inte sätta igång med någon vadslagning

Visa signatur

Cooler Master ATCS840 | Cooler Master Silent Pro Gold 1200W | Fractal Design Newton R3 1000W
ASUSTeK Z9PE-D8 WS | 2x Intel Xeon E5-2697 v2 | Kingston 128 GB DDR3 ECC | Gigabyte Geforce GTX 1070 Ti
BOINC : asteroids | einstein | enigma | milkyway | seti | universe | TheSkyNet POGS

Permalänk
Medlem
Skrivet av MikaelSwahn:

Mysko. Varför använder de inte bara 2 kretsar om max är 16 kärnor? De använder ju 4 kärnor, då låter det som att max är 32 kärnor?

Tryckfördelning med mera.

Permalänk
Medlem
Skrivet av Snigeln Bert:

Tryckfördelning med mera.

Varför göra den så stor och sen använda 2 motsatta hörn och behöva fylla i dom två andra hörnen istället för att bara göra CPUn hälften så stor och ha två stycken bredvid varandra? Känns ju inte som att det finns någon direkt anledning annat än att kunna ha 4 fungerande vid senare tillfälle

Permalänk

@MarcusHuddinge: För att TR inte var tilltänkt, det bara hände pretty much enl AMD.

att dom kör samma sockel som i deras servrar makes sense.

det verkar som att AMD inte satte sig vid ritbordet och bara: "nu ska vi göra en ny plattform som slår x99 på fingrarna"

fanns inte med på tidiga slides eller så. Kom med på dom en bit senare.

sen så har AMD porten öppen för fler kärnor i framtiden, inte för jag vet vad dom skall vara till men dom finns där.

det skulle isf ge en "8C/16T turbo på 4Ghz" ifall dom hade släppt den. det hade gått att kyla m.m med sluten kylning.

så det är ju ett alternativ.

Visa signatur

12900K, 48GB DDR5, GTX Titan Xp 12GB

Sugen på att köra e-GPU?

Permalänk
Medlem

Så vida inte processorerna skiljer sig elektriskt med annan pinout så bör de ju åtminstone i framtiden kunna producera moderkort som tar både Epyc och Threadripper. Det är ju samma sockel, så de flesta pinnarna måste vara samma. Mindre ändringar kan ske, men finns det ens någon anledning till att det inte bara är begränsat till UEFI? Tvivlar i alla fall på att sätta en Threadripper i SP3 eller en Epyc i TR4 skulle förstöra dem.

Permalänk
Medlem
Skrivet av Petterk:

Så vida inte processorerna skiljer sig elektriskt med annan pinout så bör de ju åtminstone i framtiden kunna producera moderkort som tar både Epyc och Threadripper. Det är ju samma sockel, så de flesta pinnarna måste vara samma. Mindre ändringar kan ske, men finns det ens någon anledning till att det inte bara är begränsat till UEFI? Tvivlar i alla fall på att sätta en Threadripper i SP3 eller en Epyc i TR4 skulle förstöra dem.

Problemet jag ser med att dom skulle kunna släppa Threadripper med 4 kretsar är ju att plattformen har 4 minneskanaler medens Serversidan har 8st.

Rimligtvis har varje chip 2 kanaler och dessa är rimligen fysiskt kopplade till repsektive chip.

Så ska man aktivera två chip till i Threadripper så borde dessa bli utan dedikerade minneskanaler och får förlita sig på NUMA för minnesåtkomst vilket ökar latenserna.

Jag hade ett MSI moderkort med 2st socket 940 platser men enbart en hade minnesplatser anslutna, den andra processorn gick via den första processorn för att komma åt ramminnet.

Hade AMD däremot använt 4 chip i threadripepr från början men enbart varje chip hade en minneskanal så vist då kanske man kunde ökat upp antalet kärnor.

Men sedan är ju frågan, ä det lönt med mycket mer än 16st i dagsläget med dagens DDR4?

Tror snarare att AMD kommer släppa nya chip på 7nm med fler kärnor och då stöds nog snabbare minnen, då kanske vi får se 24 kärnor på en Threadripper istället.

Jag har svårt att se att Threadripper och Epyc delar annat än sockel, skulle inte tro att dom oanvända kärnorna har någon I/O tillgänglig via socketen sedan kanske AMD använt oanvända pins för bättre strömförsörjning och liknande då det ändå är en entusiastplattform.

Självklart kan AMD släppa en ny plattform med 8st minneskanaler i framtiden om så önskas och fasa ut den gamla.

Tycker hela spekulationen om att aktivera alla 32 kärnor faller på det faktum att AMD skalat bort hälften av minneskanalerna och hälften av PCI-E banorna, det är liksom inte med i plattformen längre.

Känns mer som alla drömmer mer än nåt annat.

Permalänk
Medlem
Skrivet av SwedenVirre:

... ge en "8C/16T turbo på 4Ghz" ifall dom hade släppt den. det hade gått att kyla m.m med sluten kylning.
...

Threadripper 1900X? Den finns och är luftkyld, och 1800X har ju för den delen också turbo på 4 GHz. Menar du 32 kärnor så har du ju 1950X. Vad diskuterar du egentligen i ditt inlägg? Lite tydligare får du nog skriva.

1900X kanske inte kommer upp till 4GHz med 16 trådar som jobbar för fullt, men den bör väl pendla mellan 3,8 till 4 GHz vid sådan användning? Finns inte många genomgående test där, ser inte att man skulle behöva 4 kretsar för 4 GHz med åtta kärnor, det är ju bara att ställa in frekvensen på din 1900X manuellt om du vill ha det, eller dito med 1950X/1920X om du vill ha det med 16/12 kärnor. Eller bara köra en 1700X/1800X. Ser inte varför man skulle behöva sån värstingkylning om man siktar på 4 GHz för 8 kärnor, det gör väl ändå en del processorer med stockkylaren.

Permalänk
Medlem
Skrivet av Petterk:

Threadripper 1900X? Den finns och är luftkyld, och 1800X har ju för den delen också turbo på 4 GHz. Menar du 32 kärnor så har du ju 1950X. Vad diskuterar du egentligen i ditt inlägg? Lite tydligare får du nog skriva.

En Ryzen har turbo på 2 kärnor. Threadripper (två ryzen inuti) har turbo på 4 kärnor. Aktiverar man utfyllnadskretsarna likt en EPYC (4 Ryzen inuti) så får man möjlighet till turbo på 8 kärnor. Är det så vi ska tolka det?

Permalänk
Medlem
Skrivet av pa1983:

Problemet jag ser med att dom skulle kunna släppa Threadripper med 4 kretsar är ju att plattformen har 4 minneskanaler medens Serversidan har 8st.

Rimligtvis har varje chip 2 kanaler och dessa är rimligen fysiskt kopplade till repsektive chip.

Så ska man aktivera två chip till i Threadripper så borde dessa bli utan dedikerade minneskanaler och får förlita sig på NUMA för minnesåtkomst vilket ökar latenserna.

Jag hade ett MSI moderkort med 2st socket 940 platser men enbart en hade minnesplatser anslutna, den andra processorn gick via den första processorn för att komma åt ramminnet.

Hade AMD däremot använt 4 chip i threadripepr från början men enbart varje chip hade en minneskanal så vist då kanske man kunde ökat upp antalet kärnor.

Men sedan är ju frågan, ä det lönt med mycket mer än 16st i dagsläget med dagens DDR4?

Tror snarare att AMD kommer släppa nya chip på 7nm med fler kärnor och då stöds nog snabbare minnen, då kanske vi får se 24 kärnor på en Threadripper istället.

Jag har svårt att se att Threadripper och Epyc delar annat än sockel, skulle inte tro att dom oanvända kärnorna har någon I/O tillgänglig via socketen sedan kanske AMD använt oanvända pins för bättre strömförsörjning och liknande då det ändå är en entusiastplattform.

Självklart kan AMD släppa en ny plattform med 8st minneskanaler i framtiden om så önskas och fasa ut den gamla.

Tycker hela spekulationen om att aktivera alla 32 kärnor faller på det faktum att AMD skalat bort hälften av minneskanalerna och hälften av PCI-E banorna, det är liksom inte med i plattformen längre.

Känns mer som alla drömmer mer än nåt annat.

Fast du tänker lite tvärt om här, jag pratade om hypotetiska moderkort som skulle stödja båda och då skulle alla minneskanaler kunna populeras. På TR4 (-moderkort) kommer inte I/O-pinnarna (som inte behövs) vara kopplade till något givetvis. En sådan lösning skulle dock likna Kaby Lake-X på LGA2066 även om den inte skulle vara lika begränsad.

När AMD går till 7 nm så ser vi nog DDR5 och ny sockel hur som helst. Osäker på att de ökar antalet kärnor när de tar klivet till "7" nm. De lär ju trotts allt fortsätta köra samma kisel i desktop och server, det är bara APUerna som är en annan design i dagsläget.

Numa får du förlita dig på med både Threadripper och Epyc samt till viss del även Ryzen, det är ju vad som används utanför CCX-klustrena i kiseln och mellan kiseln (MCM) och inget du riktigt kommer ifrån, och är väl att föredra om programvaran är Numa-aware.

Permalänk
Medlem
Skrivet av MarcusHuddinge:

Varför göra den så stor och sen använda 2 motsatta hörn och behöva fylla i dom två andra hörnen istället för att bara göra CPUn hälften så stor och ha två stycken bredvid varandra? Känns ju inte som att det finns någon direkt anledning annat än att kunna ha 4 fungerande vid senare tillfälle

För att kunna använda samma befintliga tillverknings- och paketeringsprocess som EPYC vilket sparar pengar.

Visa signatur

Assembly är ett högnivåspråk.

Permalänk
Skrivet av Petterk:

Fast du tänker lite tvärt om här, jag pratade om hypotetiska moderkort som skulle stödja båda och då skulle alla minneskanaler kunna populeras. På TR4 (-moderkort) kommer inte I/O-pinnarna (som inte behövs) vara kopplade till något givetvis. En sådan lösning skulle dock likna Kaby Lake-X på LGA2066 även om den inte skulle vara lika begränsad.

När AMD går till 7 nm så ser vi nog DDR5 och ny sockel hur som helst. Osäker på att de ökar antalet kärnor när de tar klivet till "7" nm. De lär ju trotts allt fortsätta köra samma kisel i desktop och server, det är bara APUerna som är en annan design i dagsläget.

Numa får du förlita dig på med både Threadripper och Epyc samt till viss del även Ryzen, det är ju vad som används utanför CCX-klustrena i kiseln och mellan kiseln (MCM) och inget du riktigt kommer ifrån, och är väl att föredra om programvaran är Numa-aware.

jag tvivlar på att TR är en död epyc, bara för att den har hälften av kärnorna betyder inte att man bara kan dubbla minneskanaler etc. Kanske kommer fler kärnor till TR4, men tvivlar på alla server grejer som fler minneskanaler etc. Spännande men jag tror att vi vill ha mer för att de kanske går att få mer

Visa signatur

PC #1 CPU: R5 1600 @3.8 Motherboard: B350-A PRIME GPU: EVGA 1080 Ti
PC #2 CPU: i7 3770K @4.2 Motherboard: P8P67 GPU: AMD R9 290X

Permalänk
Medlem
Skrivet av Petterk:

Fast du tänker lite tvärt om här, jag pratade om hypotetiska moderkort som skulle stödja båda och då skulle alla minneskanaler kunna populeras. På TR4 (-moderkort) kommer inte I/O-pinnarna (som inte behövs) vara kopplade till något givetvis. En sådan lösning skulle dock likna Kaby Lake-X på LGA2066 även om den inte skulle vara lika begränsad.

När AMD går till 7 nm så ser vi nog DDR5 och ny sockel hur som helst. Osäker på att de ökar antalet kärnor när de tar klivet till "7" nm. De lär ju trotts allt fortsätta köra samma kisel i desktop och server, det är bara APUerna som är en annan design i dagsläget.

Numa får du förlita dig på med både Threadripper och Epyc samt till viss del även Ryzen, det är ju vad som används utanför CCX-klustrena i kiseln och mellan kiseln (MCM) och inget du riktigt kommer ifrån, och är väl att föredra om programvaran är Numa-aware.

Ja jag vet att NUMA används mellan klsutrena men varje chip ar sina två kanaler. Dom icke använda chipen har inga och får helt förlita sig på numa i ett teoretiskt fall där en 4 chip Epyc/Threadripper skulle köras i TR4 sockel.

Har svårt att se hur du ska tilldela tex en minneskanal per chip och varför skulle moderkortstillverkare släppa moderkort med 8 kanaler för att ge varje chip 2 kanaler som kanske fungerar med framtida Thredrippers?
Dom pinsen kanske redan används för Vcc och Gnd det vet vi inte.

Address och data banor är ju hårddragna så ser inte det som praktiskt att ha något som är kompatibelt med båda fallen.

Som sagt ägt flera AMD opteronsystem så vet hur numa fungerar. Threadripper plattformen är av allt att dömma inte byggd för att varje chip ska ha dedikerade kanaler utan bara 2st så 4st kommer nog inte prestera så där jättebra även om det kanske skulle kunna implementeras.

Permalänk
Medlem
Skrivet av Bloodstainer:

jag tvivlar på att TR är en död epyc, bara för att den har hälften av kärnorna betyder inte att man bara kan dubbla minneskanaler etc. Kanske kommer fler kärnor till TR4, men tvivlar på alla server grejer som fler minneskanaler etc. Spännande men jag tror att vi vill ha mer för att de kanske går att få mer

TR4 och SP3 är samma sockel, samma 4096 pinnar. Mekaniskt passar processorerna på båda. Threadripper har säkert en egen förpackning/eget substrat där två av kärnorna inte är kopplade till något redan där, och är alltså inte avaktiverade vid binning/testning. TR4-moderkort har i sin tur inget kopplat till hälften av minneskanalerna, men det går att köra en 32-kärnors Epyc med 4 minneskanaler också givetvis om de hade velat haft en kompromissad kompatibilitet.

Permalänk
Skrivet av Petterk:

TR4 och SP3 är samma sockel, samma 4096 pinnar. Mekaniskt passar processorerna på båda. Threadripper har säkert en egen förpackning/eget substrat där två av kärnorna inte är kopplade till något redan där, och är alltså inte avaktiverade vid binning/testning. TR4-moderkort har i sin tur inget kopplat till hälften av minneskanalerna, men det går att köra en 32-kärnors Epyc med 4 minneskanaler också givetvis om de hade velat haft en kompromissad kompatibilitet.

Det är mer än så bakom en procesor dock, annars hade ju Ryzen 3 samt 7 inte båda haft dual channel memory om det varit så simpelt som folk påstår. Jag säger inte att jag inte tror att de kommer komma TR4 CPUer med högre kärnantal, jag är säker på de, men jag tror inte att de är så simpelt som att de är slaktade Epyc CPUer.

Visa signatur

PC #1 CPU: R5 1600 @3.8 Motherboard: B350-A PRIME GPU: EVGA 1080 Ti
PC #2 CPU: i7 3770K @4.2 Motherboard: P8P67 GPU: AMD R9 290X

Permalänk

@ronnylov: Precis så det är menat att tolka.

32 kärnor varav 8 bör kunnas boostas till 4GHz var tanken medan dom andra ligger ganska mycket lägre.

Visa signatur

12900K, 48GB DDR5, GTX Titan Xp 12GB

Sugen på att köra e-GPU?

Permalänk
Medlem
Skrivet av pa1983:

Ja jag vet att NUMA används mellan klsutrena men varje chip ar sina två kanaler. Dom icke använda chipen har inga och får helt förlita sig på numa i ett teoretiskt fall där en 4 chip Epyc/Threadripper skulle köras i TR4 sockel.

Har svårt att se hur du ska tilldela tex en minneskanal per chip och varför skulle moderkortstillverkare släppa moderkort med 8 kanaler för att ge varje chip 2 kanaler som kanske fungerar med framtida Thredrippers?
Dom pinsen kanske redan används för Vcc och Gnd det vet vi inte.

Address och data banor är ju hårddragna så ser inte det som praktiskt att ha något som är kompatibelt med båda fallen.

Som sagt ägt flera AMD opteronsystem så vet hur numa fungerar. Threadripper plattformen är av allt att dömma inte byggd för att varje chip ska ha dedikerade kanaler utan bara 2st så 4st kommer nog inte prestera så där jättebra även om det kanske skulle kunna implementeras.

Fast man behöver inte dela på minnesplatserna, se på LGA2066 och Kaby Lake-X, hälften av minnesplatserna kan inte användas, bara 16 PCIe-banor kan användas. Tvivlar på att de gjort elektriska ändringar, för det skulle kunna döda kretsarna om någon skulle förväxla processorerna åt och sätta en Threadripper i en server eller en Epyc i en workstation. Pinnarna är ju placerade som de är för att olika saker har olika krav och Threadripper har ju lägre behov av effektmatning än Epyc. Sen är det som sagt samma kärnor, så att dra nya linor för att mata med mer effekt fungerar inte, kiseln har ju bara kopplingpunkterna som finns för det. Jag har inte pratat om att aktivera några kärnor för övrigt.

Permalänk
Medlem
Skrivet av Bloodstainer:

Det är mer än så bakom en procesor dock, annars hade ju Ryzen 3 samt 7 inte båda haft dual channel memory om det varit så simpelt som folk påstår. Jag säger inte att jag inte tror att de kommer komma TR4 CPUer med högre kärnantal, jag är säker på de, men jag tror inte att de är så simpelt som att de är slaktade Epyc CPUer.

Ryzen 3 och 7 har samma minneskontroller då det är samma kisel (som har 8 kärnor 16 trådar när allt fungerar och allt är aktiverat av AMD) som används i båda och är inte en halv Ryzen 7, minneskontrollern sitter inte i processorkärnorna utan är en egen del av systemkretsen. TR4-moderkort är inte anpassade för en processor med 4 aktiverade kretsar, men Threadripper är fortfarande en processor med samma sockel som SP3/Epyc och man skulle förmodligen kunna producera moderkort som kan köra båda så användarna skulle kunna välja mellan kärnor och frekvens.

Permalänk
Datavetare
Skrivet av Petterk:

Fast man behöver inte dela på minnesplatserna, se på LGA2066 och Kaby Lake-X, hälften av minnesplatserna kan inte användas, bara 16 PCIe-banor kan användas. Tvivlar på att de gjort elektriska ändringar, för det skulle kunna döda kretsarna om någon skulle förväxla processorerna åt och sätta en Threadripper i en server eller en Epyc i en workstation. Pinnarna är ju placerade som de är för att olika saker har olika krav och Threadripper har ju lägre behov av effektmatning än Epyc. Sen är det som sagt samma kärnor, så att dra nya linor för att mata med mer effekt fungerar inte, kiseln har ju bara kopplingpunkterna som finns för det. Jag har inte pratat om att aktivera några kärnor för övrigt.

Det @pa1983 belyser är att dagens Threadrippermoderkort har ju bara traces för 2x 2-kanalers DDR4 medan Epyc-moderkorten har 4x 2-kanalers DDR4. En hypotetisk 4-kretsars Threadripper skulle då kräva att två av kretsarna saknar "lokalt" RAM. D.v.s. du får detta

2-chip Threadripper =================== +-----------+ +---------+ +---------+ +-----------+ | | | |---| | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | |---| | | | +-----------+ +---------+ +---------+ +-----------+ 4-chip Threadripper =================== +-----------+ +---------+ +---------+ | | | | | | | 2-CH DDR4 |====| CPU |---| CPU | | | | | | | +-----------+ +---------+ +---------+ | \ / | | X | | / \ | +---------+ +---------+ +-----------+ | | | | | | | CPU |---| CPU |====| 2-CH DDR4 | | | | | | | +---------+ +---------+ +-----------+ Epyc ==== +-----------+ +---------+ +---------+ +-----------+ | | | | | | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | | | | | | +-----------+ +---------+ +---------+ +-----------+ | \ / | | X | | / \ | +-----------+ +---------+ +---------+ +-----------+ | | | | | | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | | | | | | +-----------+ +---------+ +---------+ +-----------+

En fördel Threadripper har över Epyc är att två kretsar kan ha 3x så hög kapacitet mellan sig som man har i Epyc.

I SKL-X plattformen är ju moderkorten designade för toppmodellen, d.v.s. alla traces för 4 kanalers DDR4 och högsta möjliga antalet PCIe-linor finns på varje moderkort. Med KBL-X och 6/8-kärnors modellerna av SKL-X är det vissa delar av moderkortet som inte används.

I en hypotetisk 4 kretsars Threadripper har man ju det omvända problemet. Visst kan man köra med ett Epyc moderkort, men i det läge finns ju redan den CPU som är lämpligt: Epyc.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

På bilderna från der8auer, så ser man ju att alla kluster är bondade till substratet, men att det saknas flera "caps" på PCB'n. Känns som att det är sättet de gjort för HW låsning.

Någon borde lista ut vad de bortplockade är, och ersätta med nya. Skulle gissa på att man kan få liv i några fler kärnor på det sättet.

Skickades från m.sweclockers.com

Visa signatur

Main: 5800X3D | Arctic Freezer III 360 | ROG STRIX B550-I | 32 GB DDR4@3600 MHz | Asus RTX 4080 Super TUF | Corsair RM850e | Fractal Design Define S

Permalänk
Datavetare
Skrivet av Spretcher:

På bilderna från der8auer, så ser man ju att alla kluster är bondade till substratet, men att det saknas flera "caps" på PCB'n. Känns som att det är sättet de gjort för HW låsning.

Någon borde lista ut vad de bortplockade är, och ersätta med nya. Skulle gissa på att man kan få liv i några fler kärnor på det sättet.

Skickades från m.sweclockers.com

Finns ett betydligt större problem: varje Zeppelin-krets har totalt tre st Inifinty Fabric länkar. I Epyc är varje krets kopplad till de andra tre kretsarna via IF.

I Threadripper är alla tre IF-länkar kopplade till den andra kretsen, finns därför inget sätt att överhuvudtaget koppla in de extra kretsarna i dagens Threadripper-modeller. Är detta AMD menar när de säger att de två extra kretsarna "has no path to operation".

Om man nu gjorde en hypotetisk TR-CPU där kretsarna är kopplade som i Epyc stöter man på nästa problem, dagens TR-moderkort har "bara" 2x dual-channel DDR4. Varje Zeppelin-krets har en egen minneskontroller med 2 kanaler -> finns inte tillräckligt med minneskanaler på moderkorten för en fyra kretsars TR.

Nästa steg finns redan, d.v.s. där moderkortet har stöd för 4x dual-channel DDR4. Det är Epyc.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Finns ett betydligt större problem: varje Zeppelin-krets har totalt tre st Inifinty Fabric länkar. I Epyc är varje krets kopplad till de andra tre kretsarna via IF.

I Threadripper är alla tre IF-länkar kopplade till den andra kretsen, finns därför inget sätt att överhuvudtaget koppla in de extra kretsarna i dagens Threadripper-modeller. Är detta AMD menar när de säger att de två extra kretsarna "has no path to operation".

Om man nu gjorde en hypotetisk TR-CPU där kretsarna är kopplade som i Epyc stöter man på nästa problem, dagens TR-moderkort har "bara" 2x dual-channel DDR4. Varje Zeppelin-krets har en egen minneskontroller med 2 kanaler -> finns inte tillräckligt med minneskanaler på moderkorten för en fyra kretsars TR.

Nästa steg finns redan, d.v.s. där moderkortet har stöd för 4x dual-channel DDR4. Det är Epyc.

Tack för bra redogörelse!

Visa signatur

Main: 5800X3D | Arctic Freezer III 360 | ROG STRIX B550-I | 32 GB DDR4@3600 MHz | Asus RTX 4080 Super TUF | Corsair RM850e | Fractal Design Define S

Permalänk
Medlem
Skrivet av Yoshman:

Det @pa1983 belyser är att dagens Threadrippermoderkort har ju bara traces för 2x 2-kanalers DDR4 medan Epyc-moderkorten har 4x 2-kanalers DDR4. En hypotetisk 4-kretsars Threadripper skulle då kräva att två av kretsarna saknar "lokalt" RAM. D.v.s. du får detta

2-chip Threadripper =================== +-----------+ +---------+ +---------+ +-----------+ | | | |---| | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | |---| | | | +-----------+ +---------+ +---------+ +-----------+ 4-chip Threadripper =================== +-----------+ +---------+ +---------+ | | | | | | | 2-CH DDR4 |====| CPU |---| CPU | | | | | | | +-----------+ +---------+ +---------+ | \ / | | X | | / \ | +---------+ +---------+ +-----------+ | | | | | | | CPU |---| CPU |====| 2-CH DDR4 | | | | | | | +---------+ +---------+ +-----------+ Epyc ==== +-----------+ +---------+ +---------+ +-----------+ | | | | | | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | | | | | | +-----------+ +---------+ +---------+ +-----------+ | \ / | | X | | / \ | +-----------+ +---------+ +---------+ +-----------+ | | | | | | | | | 2-CH DDR4 |====| CPU |---| CPU |====| 2-CH DDR4 | | | | | | | | | +-----------+ +---------+ +---------+ +-----------+

En fördel Threadripper har över Epyc är att två kretsar kan ha 3x så hög kapacitet mellan sig som man har i Epyc.

I SKL-X plattformen är ju moderkorten designade för toppmodellen, d.v.s. alla traces för 4 kanalers DDR4 och högsta möjliga antalet PCIe-linor finns på varje moderkort. Med KBL-X och 6/8-kärnors modellerna av SKL-X är det vissa delar av moderkortet som inte används.

I en hypotetisk 4 kretsars Threadripper har man ju det omvända problemet. Visst kan man köra med ett Epyc moderkort, men i det läge finns ju redan den CPU som är lämpligt: Epyc.

TR4-moderkorten matar såklart inte ström till mer än två kretsar heller, vilket är varför jag inte pratar om 32 kärnor i Threadripper/X399-plattformen. AMD har helt enkelt inte gjort någon Basin Falls-kompromiss. De har gjort två plattformar med samma komponenter istället.

pa1983s Socket 940-system kommer jag ihåg och är inget att prata om och det var ganska vanligt att entusiaster körde den plattformen, men att prata om minneskanaler och Numa är lite poänglöst. Det bör inte vara något som hindrar någon att köra en 32-kärnors Epyc med en minnessticka om de är allergisk mot prestanda. Det är inte någon RDRAM-parning vi talar om här. Processorerna kommer ju använda NUMA eller UMA för att hantera minneshämtningar från andra kretsar på processorförpackningen hur som helst, händer ju t.o.m. mellan CCX-kluster.

Bygger du ett moderkort som tar både Threadripper och Epyc alltså göra samma typ av kompromiss Intel gjorde så skulle du såklart använda Epyc när du behöver mer än 16 kärnor/två kretsar. Men att göra något utan kompromisser som att alla minneskanaler inte fungerar hade ju betytt att de behövt bygga processorer med fyra fungerande kretsar, och de kanske inte har Epycs med skadade CCX-kluster/kärnor för att det skulle vara någon vits med det, men samtidigt kostar en 16 kärnors Epyc inte mer än en 16 kärnors Threadripper. Dito vad det gäller 8 kärnors. Nu valde de att särskilja plattformarna åt däremot.

Hade du kunnat mata 4 kärnor med ström i TR4/X399 så hade minnesplatserna inte bytt plats som i din skiss för den delen, inte för att det spelar någon roll hur långt avstånd till minnet det skulle röra sig om två kretsar hade alltid behövt gå ut till en annan krets.

Edit: Vad det gäller bandbredd så skulle ju en Epyc med två populerade minneskontrollers fortfarande ha minst en Infinity Fabric-länk till kärnorna som har minnen anslutna, alltså en direkt anslutning om bara 42 GB/s åt båda hållen i så fall, det skulle ju fortfarande göra att två kretsar på processorn alltid har lite högre latency än de två andra. Vill man köra en sådan minneskonfiguration är det ju dock bara att köpa Epyc och bara populera 4 minneskanaler på två kärnor och inget man behöver TR4/X399 till. Nackdelen är inte direkt Numa eller UMA, det kör du ju iaf och allt ligger inte i minnet närmast utan kan ju vara utspritt och ändå behöva hoppa och ccNUMA hade du ju på olika midrange-system eller klustersystem innan de ens fick integrerade minneskontrollers där du definitivt fick ganska långt till minnet när du började köra många processorer. Går säkert att balansera en sådan lösning, men det är inget som behövs idag när man kan sätta allt minne lokalt. Edit igen: Bandbredden bör egentligen vara något problem, bandbredden kärna till DRAM är samma i kretsen som kärna till DRAM i annan krets i samma processor, och latenserna bör vara jämförbara, först när man går till en annan processor som bandbredden blir något lägre och latenserna kanske högre. Det är mer om den totala bandbredden inte skulle vara tillräcklig det kan bli lidande. Ett hopp är ju alltid bättre än två hopp i ett 2P-system också. Säkert någon som testar det hela på en Epyc så småning om vilket som.

Permalänk
Datavetare
Skrivet av Petterk:

Hade du kunnat mata 4 kärnor med ström i TR4/X399 så hade minnesplatserna inte bytt plats som i din skiss för den delen, inte för att det spelar någon roll hur långt avstånd till minnet det skulle röra sig om två kretsar hade alltid behövt gå ut till en annan krets.

Ritade skissen mest så för att det gjorde den mer symmetrisk, är ju ett hopp mellan alla kretsar i en single-socket Epyc-konfiguration så kvittar vilka två kretsar man ger lokalt RAM till. Resultatet hos en hypotetisk TR-CPU i dagens TR-moderkort blir alltid att två kretsar får lokalt RAM, två kommer sakna lokalt RAM. Alla kretsar har exakt ett hopp till all övrigt "avlägset" RAM.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Ritade skissen mest så för att det gjorde den mer symmetrisk, är ju ett hopp mellan alla kretsar i en single-socket Epyc-konfiguration så kvittar vilka två kretsar man ger lokalt RAM till. Resultatet hos en hypotetisk TR-CPU i dagens TR-moderkort blir alltid att två kretsar får lokalt RAM, två kommer sakna lokalt RAM. Alla kretsar har exakt ett hopp till all övrigt "avlägset" RAM.

Har Threadripper alla IF-länkar ihopkopplade så är väl en av Threadrippers fördel att den är starkare på Numa än Epyc, inte att den skulle slippa använda det Hur som helst det var inte en "upplåst" TR jag pratade om så problemet pa1983 tar upp skulle inte existera på ett moderkort som tar båda processorerna och det var det han försökte svara på.

Bör gå att testa det påståendet. Vet inte om det är byggt för att ens ge något med fler länkar på det sättet dock.

För övrigt, alltså ett moderkort för båda processorerna hade ju t.ex. kunnat köra Threadripper för att ge högre frekvenser och möjlighet till överklockning och Epyc när fler kärnor och lägre frekvenser utan möjlighet till överklockning önskas samt fler PCIe-banor, men det är ju samma kompromiss som Intel försökte med på Basin Falls/X299/LGA2066 och den fungerar i princip inte, iaf inte bättre än överklockningsbara rena Epyc skulle lira. För det omvända borde AMDs UMA-läge kunna kompensera för att allt minne inte är lokalt/near och jämna ut lite, men då skulle allt få högre latenser som jag fattar det utan att studera djupare. UMA eller NUMA verkar inte spela någon roll på vanliga laster däremot. UMA är standardläget hos AMD hur som helst och man måste såklart inte köra Numa, även om det kan vara en fördel. Sen har du ju AMDs game-mode som skulle kunna stänga av hela kretsar i de fallen du behöver låga latenser och klarar dig med färre kärnor, men det är knappast något folk behöver hålla på med.

Permalänk
Datavetare

@Petterk: AMD har sagt detta om Threadripper

Varje "on-die" IF-länk har en bandbredd på DDR4 frekvens * bussbredd = 2667(MT/s) / 2 (två transfers per cykel) * 256 / 8 (128 bitar) = 42,7 GB/s

För att nå 102,2 GB/s måste man ha fler än två IF-länkar. Vet inte riktigt varför det blir 102,2 i stället för 128,9 GB/s. För Epyc listar AMD "42,6 GB/s die-to-die bandwidth" vilket är exakt kapaciteten för länken.

Så TR har rejält mycket mer die-to-die bandbredd jämfört med Epyc, något som absolut hjälper till i vissa användarfall. För desktop-laster är normalt latens viktigare, å andra sidan kan man hjälpa upp latensen genom att tvinga ner program till en specifik krets. Fungerar ju så länge programmet klarar sig på max 8 kärnor, vilket är typ 99,9 % av alla program

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

@Petterk: AMD har sagt detta om Threadripper
https://images.anandtech.com/doci/11697/threadripper_architecture-final_16.jpg

Varje "on-die" IF-länk har en bandbredd på DDR4 frekvens * bussbredd = 2667(MT/s) / 2 (två transfers per cykel) * 256 / 8 (128 bitar) = 42,7 GB/s

För att nå 102,2 GB/s måste man ha fler än två IF-länkar. Vet inte riktigt varför det blir 102,2 i stället för 128,9 GB/s. För Epyc listar AMD "42,6 GB/s die-to-die bandwidth" vilket är exakt kapaciteten för länken.

Så TR har rejält mycket mer die-to-die bandbredd jämfört med Epyc, något som absolut hjälper till i vissa användarfall. För desktop-laster är normalt latens viktigare, å andra sidan kan man hjälpa upp latensen genom att tvinga ner program till en specifik krets.

Core to DRAM on-die och Core to DRAM off-die på samma processor/substrat är i båda fallen fulla minnesbandbredden. Latenser kan nog vara snarlika mellan kretsar på samma processor som inom samma krets, när vi talar om att gå mellan CCX-kluster åtminstone. UMA är påslaget som standard och bör väl jämna ut latenserna något, men det betyder att den sprider ut minnet också. Hur som helst, game-mode vs standard är ju i princip NUMA vs UMA och det i sig verkar inte direkt göra någon nytta. De högre latenserna med UMA verkar inte döda prestandan. En 32-kärnor Epyc kanske skulle göra bra från sig med fyra kanaler/två minneskontrollers populerade, men det är som sagt tvärt om som jag spekulerade om när det gäller var man kan köra en sådan krets, jag tycker det verkar klart att det är annan förpackning/substrat för TR och att TR inte är Epyc-processorer som fallerat i testprocessen. Skulle nog vara svårt att koppla ihop fler IF-länkar annars om inte annat. Och skulle de göra något liknande för SP3 skulle de fortfarande behöva annan förpackning, Epyc-processorerna kan inte ha defekta kretsar så vitt jag vet och precis som på LGA2066 och KBL-X måste de anpassa förpackningen på något sett så den lirar med massor saker okopplade utan problem. Tror inte ett SP3-moderkort skulle gilla att en eller två krets inte initialiserar sig, men elektriskt bör de vara så lika att det bör gå att producera ett moderkort som gillar båda. De behöver dock särskilja plattformarna åt, annars hade de lika gärna kunna sälja 16-kärnors Epyc med 4 fungerande kretsar och 8 minneskanaler som en överklockningsbar entusiastmodell. Var snarare den vägen jag trodde skulle ske med entusiastplattformen innan TR annonserades, och 16-kärnors Epyc kostar fan inte ens mer än TR. Sen kör väl inga Epyc-moderkort något chipset heller, men det finns väl ingen anledning till att de (processorerna) inte skulle kunna använda några av sina PCIe-banor till det. Det är ju inget som egentligen behövs med massor inbyggda funktioner i fyra kretsar dock.

När man går processor till processor går dock bandbredden ner något för IF-länkarna. Bandbredden mellan processorerna i 2P-system bör dock bli 151,6 GB/s sammanlagt (Core to DRAM mellan/på andra processorn bör dock gå ner till ~89 % av bandbredden) när vi räknar på ett DDR4-2667-system och som Cutress på Anandtech påpekar så är det enda som någorlunda matchar 102,22 GB/s två 51,2 GB/s-länkar. Där stämmer nog AMDs tidigare material, två IF-länkar med 3200 MT/s minne som det tydligt står i den sliden, minneshastigheten alltså. Nog för att 102,22 bör bli minne som går i ~1597 MHz, vilket är troligt att minnet faktiskt körs i, men varför inte använda den teoretiska siffran för den specade frekvensen? Faktiskt frekvens kommer ju ändå skilja ett par MHz mellan olika brädor

Låter alltså konstigt att de nu tycker det är tre länkar som är sammankopplade. Som du säger, då borde siffran vara 128 GB/s vid DDR4-2667. Hur som helst, halva sockeln används ju inte på TR4 och det är lite flott Nästan så man kan tycka att de kunde gjort nya socklar, moderkortstillverkarna och kyltillverkarna hade nog gillat det iaf. Men aja, döda kretsar kommer de ju alltid att ha längst ut mot kanterna och de "överblivna" hela kärnorna kan de ju sälja som Ryzen.