AMD visar 3D-staplade kretsar – introducerar 3D V-Cache för processorer

Permalänk
Inaktiv
Skrivet av JonasT:

Riktigt häftigt! Ska bli intressant att se om värmeöverföringen från kärnorna till värmespridaren påverkas nämnvärt.

Med mer cache tillgängligt för processorn kan det tänkas att trycket på minneskontrollern sjunker, vilket skulle kunna innebära en strömbesparing och minskning av värmeutvecklingen - sedan kan man ställa det kontra den högre utnyttjandegraden av processorresurserna som AMD presenterar istället, vilket innebär höjd värmeutveckling.

Intressant med motstridiga faktorer att hålla rätt på - och samtidigt ett företag som lockar med lite små utvalda fakta medans de torterar oss genom att hålla hela bilden gömd under påslakanen... Vill inte längta till vintern och årsslutet för den fulla presentationen nu när sommarvärmen äntligen är här, men... Faen också! lol

Saknar också en lista över de spel som har stöd för AMDs uppskalningsteknik.

Förr eller senare måste ett grepp tas för övrigt för att få bort kravet på specialstöd från spelutvecklarna för sådana här tekniker. Introducera ett officiellt sätt att plugga in uppskalningsfilter i renderingsprocessen, för det är redan för tjafsigt med bara två varianter som vart och ett bara stöds av ett fåtal titlar. Lägg till Intel kommandes med sin egen teknik vore ju som lök på laxen helt enkelt...

Permalänk

Vill minnas att jag hade en diskussion här för inte så länge sedan med någon som kände att nästa steg i processortillverkning rimligen skulle byggas av myoner, elektroner och kvarkar istället för 3D-staplas.
Kul att vi redan är här!

Visa signatur

i7 6700k @4,1 base - 4,4 Turbo | XFX 590X Fatboy | Gigabyte Z270 D3 | 2x16 GB Corsair Vengence 3200MHz Cl 16| Intel 750 400GB |EVO 970 1 TB Steamdrive| 64TB thin provision

Permalänk
Medlem

Så det kommer ingen ny threadripper då ?

Visa signatur

[Intel Core i9@13900KF Raptor Lake@5,5Ghz Oc][Asus ROG Z790 HERO[G-Skill RGB 32GB 6600Mhz cL34][WD Back 2TB NvMe][2TB Samsung 970 Evo + 2x8Tb Samsung 870 Qvo spel disk][Msi RTX 4090 Gaming Trio-X][ASUS ROG Swift OLED PG48UQ][Windows 11][1000/1000Mbits Telia fiber][Razer Ornata Tangentbord.

Permalänk
Medlem

Det här kommer bli riktigt intressant för APUer, tror det kan göra en väldigt stor skillnad. APUer på PC-sidan är väldigt begränsade av minnesbandbredden.

Sen är det så klart spännande för andra områden med.

Skrivet av anon132576:

Med mer cache tillgängligt för processorn kan det tänkas att trycket på minneskontrollern sjunker, vilket skulle kunna innebära en strömbesparing och minskning av värmeutvecklingen - sedan kan man ställa det kontra den högre utnyttjandegraden av processorresurserna som AMD presenterar istället, vilket innebär höjd värmeutveckling.

Högre effektivitet ger lägre totalförbrukning för att slutföra en uppgift. Bortkastade CPU-cykler är inte gratis.

Men om den högre effektiviteten används till att trycka ut ännu fler fps än tidigare, ja då blir troligen totalförbrukningen också högre.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem
Skrivet av Jacob:

En CCD-chiplet med åtta Zen 3-kärnor och 32 MB L3-cacheminne mäter drygt 80 kvadratmillimeter (mm²), medan SRAM-kretsen ligger på 6 × 6 millimeter (mm).

För att vara petig: Är det inte rimligare att skriva att SRAM-kretsen är 36 kvadratmillimeter när du använder det måttet för den andra delen av paketet?

Permalänk
Medlem

Tycker detta påminner mig om något, ja just det! Intel 57... nånting? 🤫 Riktigt nice att AMD nyttjar detta för att slå undan benen på Intel i det segment Intel skryter om, spel.

Visa signatur

Star Citizen ❤

Permalänk
Medlem

En ökning på 15% i spel och troligtvis (betydligt) lägre i program är inte särskilt imponerande för en så dyr och komplicerad teknik. Känns också som en död ände, för vad ska de göra, lägga ännu mer cache? Såvida inte framtida arkitekturförändringar kan dra nytta av det.

Det som är mer intressant är vad de kan stapla förutom CPU-cache. Som en annan sade, staplad cache på RDNA3 kan bli mycket intressant.

Visa signatur

Arch Linux - i5 12500@4.75GHz - Asrock B760M PG Riptide - 32GB DDR5 6000MHz - RTX 2070 Super - 1TB SN770 - 1TB SN550 - U32PWQU 4K
Dell Latitude 7400 2 in 1 - Arch Linux - i5 8265u

Permalänk
Medlem
Skrivet av sesese:

Nu är frågan hur jag ska göra med 5800X som kom hem igår. Min nuvarande 3700X är inte dålig.

Beror ju på, 5800x ger ungefär 150 fps mer i CS GO jämfört med 3700x till exempel. Är det värt det...njaa..är man ute efter 600 fps så är det ju en bra grej.
När jag bytte från 3700x till 5800x gjorde det exakt 150 fps på benchmarkbanan.

Visa signatur

Chassie Louqe Ghost S1 MKIII Limestone, Moderkort Gigabyte B550I AORUS PRO AX, RAM minnen G.SKill Trident Z Neo RGB 32GB, CPU AMD Ryzen 7 5800X, KylareNoctua Ghost S1 Edition, GPU Powercolor Radeon RX 6800 16GB, Systemdisk Samsung 970 EVO Plus series 500GB M.2, Sel/programdisk SSD 2x Samsung 850 EVO 120/500 GB, PSU Corsair sf750w, Skärm Samsung c32hg70 144hz,Mus Logitech g603 wireless gamingmouse, Tangentbord Logitech g613 wireless gaming keyboard

Permalänk
Medlem
Skrivet av Fire_Ice:

En ökning på 15% i spel och troligtvis (betydligt) lägre i program är inte särskilt imponerande för en så dyr och komplicerad teknik. Känns också som en död ände, för vad ska de göra, lägga ännu mer cache? Såvida inte framtida arkitekturförändringar kan dra nytta av det.

Det som är mer intressant är vad de kan stapla förutom CPU-cache. Som en annan sade, staplad cache på RDNA3 kan bli mycket intressant.

Är det just att du förmodar en större effekt på prestandan vad gäller RDNA3 som skulle göra just det intressant? För det är väl lika mycket återvändsgränd utifrån det tidigare resonemanget?

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av mrpijey:

Vermeer var ju den sista AM4-proppen som skulle komma, så något nytt kommer nog inte till den, utan det blir nog den nya sockeln med pinnarna på moderkortet.

Jag tänker dock iom att alla tillverkarna precis börjat släppa passivt kylda X570 så kanske det ändå är AM4 och X570/B550 som de kommer släppas till?

Visa signatur

ASUS ROG Crosshair X670E Gene| AMD Ryzen 9 7800X3D Delidded | Custom EK Watercooling| WD Black SN850X 1TB + WD Black SN850X 2TB| Corsair Vengeance, DDR5-6600 64GB (2 x 32GB) @6400MHz CL 30-38-38-76| AMD Radeon RX 7900 XTX| LG UltraGear 45GR95QE OLED| MSI MPG A1000G PCIE5 1000W| Lian Li O-11 EVO|

Permalänk
Medlem
Skrivet av pytonOrm:

Så det kommer ingen ny threadripper då ?

Undrade också det, var ju det jag hade förväntan på igår.

Visa signatur

MSI X99A GODLIKE GAMING | i7-6950X 4.3GHz | 64GB RAM 3200MHz | RTX 2080

Nintendo Switch | PlayStation 5 | Xbox Series X

Min FZ Profil

Permalänk
Medlem
Skrivet av fredrik831:

Den diamanten på Lisa Su:s finger var då inte liten…

Det var faktiskt min första tanke när jag såg bilden igår.
Är nog så att hennes man (eller har hon en fru?), om han inte har ett fett jobb, kan ha investerat i AMD-aktier med god avkastning för att ha råd med den stenen

Permalänk
Medlem
Skrivet av napahlm:

Det var faktiskt min första tanke när jag såg bilden igår.
Är nog så att hennes man (eller har hon en fru?), om han inte har ett fett jobb, kan ha investerat i AMD-aktier med god avkastning för att ha råd med den stenen

Hon har på någon konferens berättat att hennes man är en gedigen gamer och har höga krav på på spel prestanda

Permalänk
Medlem
Skrivet av JonasT:

Riktigt häftigt! Ska bli intressant att se om värmeöverföringen från kärnorna till värmespridaren påverkas nämnvärt.

Anandtech hade en uppdatering där de bla nämde det (sist i artikeln):
https://www.anandtech.com/show/16725/amd-demonstrates-stacked...

Citat:

As the V-Cache is built over the L3 cache on the main CCX, it doesn't sit over any of the hotspots created by the cores and so thermal considerations are less of an issue. The support silicon above the cores is designed to be thermally efficient.

Men såklart väntar man med spänning på att Sweclockers testar

Visa signatur

--
A shark on whiskey is mighty risky, but a shark on beer is a beer engineer.

Permalänk
Datavetare

Skulle vara väldigt intressant att få en förklaring till varför die-shots av Zen2 indikerar att 32 MB L3$ i stort sätt tar lika stor kretsyta som denna cache-krets kan få plats med 64 MB på. Det handlar trots allt om TSMC 7 nm i båda fallen.

En kanske ännu intressantare fråga är: vad är det spel gör som fundamentalt verkar skilja sig från det mesta andra som görs på en typiskt PC? AnandTech riktade ljuskäglan på detta

"On the performance, we’ve seen L3 cache depth improve gaming performance, both for discrete and integrated gaming. However, increased L3 cache depth doesn’t do much else for performance. This was best exemplified in our review of Intel’s Broadwell processors, with 128 MB of L4 cache (~77 mm2 on Intel 22nm), wherein the extra cache only improved gaming and compression/decompression tests. It will be interesting to see how AMD markets the technology beyond gaming."

Går man tillbaka och tittar på testerna av Ryzen 5000-serien och specifikt fokuserar på AMDs påstådda IPC-ökningar mellan Zen2 till Zen3 ser man även där att ökningen i spelprestanda ligger definitivt på och i vissa fall över den gen-on-gen ökning AMD om 19 % påstod.

Väldigt mycket pekar på att en stor del av förklaringen här ligger i att L3$-storleken dubblades mellan Zen2 och Zen3. Även spekulationerna om att single-compute-die kretsarna skulle få fördelar i just spel över 5900X/5950X verkar inte heller stämma, vinsten att ha dubbla mängden L3$ och verkar i majoriteten av spelfallen vägas upp den högre latens som finns mellan CPU-kretsarna.

Tittar man däremot utanför spel var Zen2->Zen3 vinsten i IPC inte i närheten av några 19 %, kikar man på de icke-spel-tester som SweClockers gjorde låg IPC ökningen mer runt 10 %.

Så tekniken AMD jobbar med här ser riktigt spännande ut för spel, tyvärr inte lika roligt för det mesta andrar givet hur mycket kiselyta det kostar utan att egentligen verka ge något alls.

Å andra sidan finns en vettig poäng att spendera mer kretsyta på just cache: för varje krympning ökar W/mm^2 för "vanlig logik". SRAM utvecklar inte alls lika mycket effekt per areaenhet, så om inte annat är det vettigt att spendera mer kretsyta på cache för att få en rimlig totaleffekt på kretsen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Hint: Ni minns kanske AMD's presentationsslide för Zen3 Epyc Milan där det stod 32MB "+" 😉

Visa signatur

[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Yoshman:

Skulle vara väldigt intressant att få en förklaring till varför die-shots av Zen2 indikerar att 32 MB L3$ i stort sätt tar lika stor kretsyta som denna cache-krets kan få plats med 64 MB på. Det handlar trots allt om TSMC 7 nm i båda fallen.

Anandtech frågade precis det och förklaringen är att den stackade cachen använder SRAM-specifik process och är därför signifikant tätare jämfört med den process som cpu-kärnor+SRAM använder.

Visa signatur

--
A shark on whiskey is mighty risky, but a shark on beer is a beer engineer.

Permalänk
Skrivet av Pholostan:

Anandtech frågade precis det och förklaringen är att den stackade cachen använder SRAM-specifik process och är därför signifikant tätare jämfört med den process som cpu-kärnor+SRAM använder.

Det är antagligen nån variant av High Density libbarna istället för High Performance libbarna som används. Finns ju också massor med andra tweaks som går att göra på SRAM arrayer vilket ger olika storlek. Geometri är väl den största, sen olika nivåer av redundans, olika power down/retention funktioner, osv. Eftersom de påstår att det inte är nån direkt synlig skillnad i latens för den utökade arrayen så kan man väl anta att det mesta är ganska likt. En annan anledning verkar vara att existerande Zen3 dies redan är designade för det här. Förmodligen ligger tagar och annan kritisk logik i den existerande L3 ytan vilket gör att den tar mer plats. Det är också TSV:er i den ytan som tar plats. Det borde va lika mycket TSV yta på SRAM chippet men det ger väl viss inverkan på ration.

Visa signatur

/Hej hopp!

Permalänk
Medlem
Skrivet av multimiffo:

Det är antagligen nån variant av High Density libbarna istället för High Performance libbarna som används. Finns ju också massor med andra tweaks som går att göra på SRAM arrayer vilket ger olika storlek. Geometri är väl den största, sen olika nivåer av redundans, olika power down/retention funktioner, osv. Eftersom de påstår att det inte är nån direkt synlig skillnad i latens för den utökade arrayen så kan man väl anta att det mesta är ganska likt. En annan anledning verkar vara att existerande Zen3 dies redan är designade för det här. Förmodligen ligger tagar och annan kritisk logik i den existerande L3 ytan vilket gör att den tar mer plats. Det är också TSV:er i den ytan som tar plats. Det borde va lika mycket TSV yta på SRAM chippet men det ger väl viss inverkan på ration.

Jag tycker det är häftigt att se hur ett så stort företag kan jobba så synkroniserat. Att de har varit så framsynta att de har planerat för det här i flera år… vackert.