AMD Ryzen 7 4700G på bild – åtta kärnor Zen 2 med integrerad grafik

Permalänk
Medlem

Ni som önskar snabbare APU, det gör jag med. Men minnesbandbredden håller tillbaka. Det är inte försvarbart att bygga socklar och moderkort med snabbare minneslösningar för en APU, det blir GDDR6 på moderkortet eller extra DDR4-kanaler och det är inte gångbart. DDR5 kan ju befoga snabbare GPU:er igen men det är fortfarande allt för begränsande.

Lösningen är såklart MCM och chipstacking med HBM. Men det är fortfarande för dyrt i förhållande till vanliga grafikkort. Inte minst för att det krävs en del GB för att det ska duga åt en snabbare GPU. Det har ju gjorts till bärbara där priset kan fläskas på med Intels Vega RX bestyckade Kaby Lake G.

Ser man till AMDs APU:er så har teoretiska prestandan mellan Llano och Picasso gått upp över 400%, praktiskt har den gått upp ännu mer. Medan minnesbandbredden bara gått upp drygt 50%, även fast AMD nog säkert kan få ut mer nytta av bandbredden genom texturkomprimering idag. Därför vi också ser en minskning av antalet beräkningsenheter med Renoir. Beräkningsprestanda och minnesbandbredd går båda upp runt 9% ändå.
Man ser ju också hur överklockning av APU är ganska poänglöst men minnesöverklockning har varit väldigt värt ända sedan gamla VLIW-APU:erna.

Tror att konkurrens från Intels grafiksatsningar och ett större genomslag på HBM med lägre priser kan ge roligare utveckling framöver. Jag hade hoppats på denna utvecklingen tidigare, och tror nog AMD hoppats på lägre priser på HBM tidigare också.

Permalänk
Inaktiv
Skrivet av serverfel:

Han ska ju ha något att göra när han besöker henne. Dööööh!

Haha, så klart! Borde jag tänkt på

Skrivet av Herr Kantarell:

Surfing the interwebs m.m. Jag tänkte mig 4 eller 6 kärnors varianten och är det idag 2020 så himla kraftfullt?

Hon kör en icke K Sandybridge idag.

Sandy Bridge håller ju länge än för surf.

Permalänk
Medlem

Vad tror ni det finns för chanser att vi ser samma möjligheter att använda grafikdelen för att avlasta dedikerat kort som på intel? Skulle vara awesome.

Permalänk
Medlem
Skrivet av ipac:

Kräver ju ett moderkort med GDDR6, med allt vad det innebär. En speciallösning, skulle säkert kosta en slant.

Ser inte hur en sådan produkt skulle få konsolerna på fall dock.

Jag tyckte tidigt att de med den nya arkitekturen från zen-2 (med io och chiplets) skulle göra en threadripper apu; 1 cpu chiplet, en gpu chiplet, och 2 HBM2 chiplets, och så ett itx mobo till den.
Låter man dessutom systemet använda HBM2 tror jag man skulle kunna göra mycket roligt med en sån setup

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk

AMD går som tåget!

Permalänk
Medlem

men men men men släpp den nu!
Det är så taskigt att ha färdiga produkter redan kvartal innan lansering. alltid denna teasing.

Visa signatur

Rgeek L65, hdplex 200w, 4650G, Asrock a520 ITX, Crucial 32gb 3600 cl16, Black ridge.

Permalänk
Medlem
Skrivet av Aleshi:

Ni som önskar snabbare APU, det gör jag med. Men minnesbandbredden håller tillbaka. Det är inte försvarbart att bygga socklar och moderkort med snabbare minneslösningar för en APU, det blir GDDR6 på moderkortet eller extra DDR4-kanaler och det är inte gångbart. DDR5 kan ju befoga snabbare GPU:er igen men det är fortfarande allt för begränsande.

Lösningen är såklart MCM och chipstacking med HBM. Men det är fortfarande för dyrt i förhållande till vanliga grafikkort. Inte minst för att det krävs en del GB för att det ska duga åt en snabbare GPU. Det har ju gjorts till bärbara där priset kan fläskas på med Intels Vega RX bestyckade Kaby Lake G.

Ser man till AMDs APU:er så har teoretiska prestandan mellan Llano och Picasso gått upp över 400%, praktiskt har den gått upp ännu mer. Medan minnesbandbredden bara gått upp drygt 50%, även fast AMD nog säkert kan få ut mer nytta av bandbredden genom texturkomprimering idag. Därför vi också ser en minskning av antalet beräkningsenheter med Renoir. Beräkningsprestanda och minnesbandbredd går båda upp runt 9% ändå.
Man ser ju också hur överklockning av APU är ganska poänglöst men minnesöverklockning har varit väldigt värt ända sedan gamla VLIW-APU:erna.

Tror att konkurrens från Intels grafiksatsningar och ett större genomslag på HBM med lägre priser kan ge roligare utveckling framöver. Jag hade hoppats på denna utvecklingen tidigare, och tror nog AMD hoppats på lägre priser på HBM tidigare också.

Eller en billigare lösning likt den som Intel hade på Intel Core i7-5775C och i5-5675C "Broadwell", 128 MB eDram...

En användare på TPU testade och fick nära på +30% prestandaökning.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av dinlo:

Vad tror ni det finns för chanser att vi ser samma möjligheter att använda grafikdelen för att avlasta dedikerat kort som på intel? Skulle vara awesome.

Det har väl AMD redan, om det diskreta kortet är ett AMD, vill säga...

För Nvidia kort så sägs det endast fungera med Intel CPU'er, IgorsLAB ger lite insikt i problematiken. Mest är det om effekt fördelning i notebooks men lite nämns.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av sweisdapro:

Jag tyckte tidigt att de med den nya arkitekturen från zen-2 (med io och chiplets) skulle göra en threadripper apu; 1 cpu chiplet, en gpu chiplet, och 2 HBM2 chiplets, och så ett itx mobo till den.
Låter man dessutom systemet använda HBM2 tror jag man skulle kunna göra mycket roligt med en sån setup

Tänkte fel, med nya threadripper skulle man kunna ha 2 cpu, 2 gpu och 4 minne till och med (förutsatt samma chiplet-storlek)
16c32t i en apu...

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk
Medlem
Skrivet av sweisdapro:

Tänkte fel, med nya threadripper skulle man kunna ha 2 cpu, 2 gpu och 4 minne till och med (förutsatt samma chiplet-storlek)
16c32t i en apu...

Nu verkar du verkligen röra ihop det rejält!

Treadripper är ju en helt annan historia.
Zen 2 Treadripper

8 st 8 core chip + I/O krets

Zen Treadripper

4 st 8 core chip med I/O i varje

Zen 2 Ryzen

2 st 8 core chip + I/O

Renoir

Ett enda 7 nm substrat

Ryzen 4000G är samma chip som för bärbara men med en högre strömbudget.

Så hur tänkte du nu

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Bengt-Arne:

Det har väl AMD redan, om det diskreta kortet är ett AMD, vill säga...

För Nvidia kort så sägs det endast fungera med Intel CPU'er, IgorsLAB ger lite insikt i problematiken. Mest är det om effekt fördelning i notebooks men lite nämns.

Till min förståelse så var det väl vissa kort som kunde använda crossfire med vissa processorer?

Permalänk
Medlem
Skrivet av dinlo:

Till min förståelse så var det väl vissa kort som kunde använda crossfire med vissa processorer?

Ja, det var något som AMD stödde i några generationer av APU, kommer inte ihåg vilkat men kan nog utläsas på wikipedia.
Det krävde att GPU arkitekturen var likvärdig med APU GPU'n, samt att det inte skilde för mycket i antal CU.
Man kunde då köra valfritt iGPU, eGPU eller iGPU + eGPU (Crossfire)

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Bengt-Arne:

Nu verkar du verkligen röra ihop det rejält!

Treadripper är ju en helt annan historia.
Zen 2 Treadripper
https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcQN084O8V_bwguT9KGRLdMlItfc_wRBuc6AbJ-lrSE1-K0Gmiit&usqp=CAU
8 st 8 core chip + I/O krets

Zen Treadripper
https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcTMRE-mRwDgwaoXRAWKND74xNBNhoUj1PJUMJZC3vxRrMdY8hAH&usqp=CAU
4 st 8 core chip med I/O i varje

Zen 2 Ryzen
https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcSiWsaMY0rW1ewQxVG9FJEIxrkryAVyGRT0Azh_7JDtZ-f25en0&usqp=CAU
2 st 8 core chip + I/O

Renoir
{ data-uri }

Ett enda 7 nm substrat
{ data-uri }

Ryzen 4000G är samma chip som för bärbara men med en högre strömbudget.

Så hur tänkte du nu

Läste du ens mitt första inlägg? Jag skrev om en ÖNSKAD apu på threadripper plattformen, men tänkte fel kring hur många chiplets som satt i Zen2 varianten

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk
Datavetare
Skrivet av Bengt-Arne:

Eller en billigare lösning likt den som Intel hade på Intel Core i7-5775C och i5-5675C "Broadwell", 128 MB eDram...

En användare på TPU testade och fick nära på +30% prestandaökning.

Man får alltid vara lite skeptisk när en enda användare rapporterar helt fantastiska siffror, men det är helt sant att eDRAM i dessa hjälpte till en hel del. SweClockers hade ju med den modellen fram till 8000-serien, så SweC kör med rätt långsamt RAM hängde 5775C med 7700K/8400 vilka alla generellt var snabbare än 2600X/2700X i spel.

Effekten av eDRAM är egentligen densamma som att ha riktigt snabbt RAM, något man man se i TechReports test där i5-8400 samt Ryzen 2600X/2700X alla kör med DDR4-3200. 5775C har väldigt snarlik prestanda som dessa, men i detta test är rent tekniskt den långsammaste av dess fyra. eDRAM var vettig i laptops, i alla fall innan LPDDR5, då det är mer energieffektivt jämfört med att högt pressade DDR3/4 kretsar. Men förutom Apple verkar ingen speciellt intresserad att ens betala den extrakostnad eDRAM ger, vilket som du påpekar lär vara mindre än lösningar som HBM...

Precis som @Aleshi skriver är just bandbredd en rejäl flaskhals för integrerade GPUer. Och även om man fixar det kommer man bara slå i nästa flaskhals, kylningen... Både AMDs och Intels senaste GPUer är kraftigt effektbegränsade vid 15 W TDP. U-modellerna från båda dessa har konfigurerbar TDP, från 12 W till 25 W. Mätningar på Ice Lake visar att GPU-prestanda går upp 30-40 % när man ställer 25 W modeller mot 15 W. Sist jag kollade var alla Ryzen 4000-laptops som testas konfigurerade med 20-25 W TDP, det lär behövas för att GPU-delen på något vettigt sätt ska kunna användas samtidigt som CPU.

Det sista är nyckeln! Starka APU/iGPU är definitivt inte bortkastat, men det lär nog aldrig fungera speciellt bra för spel utan det man borde rikta in sig på till 100 % är GPGPU! Även i 4000-serien med 8 CPU-kärnor är GPU-delen ungefär dubbelt så snabb på uppgifter som lämpar sig att köra på GPU. Det förutsatt att CPU-delen kör fullt optimerad AVX-kod över alla kärnor, annars är skillnaden väsentligt större.

Vad som måste finna för att man ska kunna använda GPUn på något vettig sätt är bibliotek och verktyg för att kunna utnyttja GPUn på ett bra sätt. Det märkliga här är att AMD inte officellt stödjer APUer i "HIP" (i praktiken en CUDA-rippoff, vilket är OK då folk känner till CUDA och det är långt bättre än OpenCL). Just nu är HIP Linux-only, men man ska jobba på en Windows-version.

Egentligen alla bibliotek som AMD själva jobbar för att ge GPGPU-stöd använder sig numera av HIP, så för dem verkar OpenCL vara ett avslutat kapitel.

Fördelen med GPGPU är att det finns massor med fall som inte kräver massiv RAM-bandbredd, alla dessa fungerar därför fint på APU/iGPU.

Intel försöker dra det ännu längre med oneAPI. CUDA/HIP kräver fortfarande att man skriver en separat version för CPU och en för GPU, med oneAPI skriver man "vanligt" C++ som kompileras till ett format som kallas SPIR-V (ett öppen format framtaget av Khronos group). Likt GPU-shaders kompileras SPIR-V till aktuellt CPU, GPU etc på varje system. Den stora fördelen (i teorin, vi får se hur det fungerar i praktiken när Xe släpps...) med oneAPI är att man bara behöver skriva en version som kan köras överallt, det går även att samtidigt köra den på CPU och GPU vilket är perfekt för APU/iGPU!

Edit: HIP är API och verktyg. Program skrivna mot HIP kan köras både på AMDs GPUer (då med ROCm-drivers och eventuellt även på något motsvarande för Windows i framtiden) samt även på Nvidia GPUer (då via CUDA).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@sweisdapro: Jag slutade när du tappade antal chiplets

Var även det som jag rättade till

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem

De enda kategorier där processorn är rätt som jag kan komma på är:
1. Hobbyidkare med begränsad budget som har nytta av någorlunda kraftfull CPU men inga särskilda krav på GPU.
2. Någon som vill bygga en kraftfull speldator men spara utgiften för grafikkortet till senare.

Kan någon ge några exempel på när denna processor skulle vara det optimala alternativet för yrkesmässigt bruk?
Jag har svårt att komma på något exempel där en sådan här mellanklass CPU, för snabb för vanliga kontorstillämpningar och för klen som workstation, är optimal. Särskilt med tillägget "stationär dator".

Permalänk
Medlem

@Olle P: Den kommer säkert att gå som smör på vissa marknader i form av workstation för CAD.
Redan tidigare APU (Icke Ryzen) såldes i Pro variant för workstation och då mest i Asien.

Har själv tänkt att investera i en för ett kompakt bygge här hemma och köra 3D CAD på den.
Radeon Pro WX 2100/3100 är inte kraftfullare än GPU'n i 4700G.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem

@Yoshman: eDram är väl en form av framebuffer catch, så det frigör bandbredd till det vanliga minnet. Lite av ett dubbelt win win, i form av eDram bandbredd + Minnes bandbredd.

Ryzen 7 4700G har ju ett större termiskt svängrum på 65W än vad U och H varianterna har, så det bör inte ge samma begränsning.
Är lite fel att jämföra med Radeon Pro WX 2100/3100 som jag har för mig är på 35 W (hela kortet, minne m.m.) så den inbyggda GPU'n bör ju inte ha större effektkrav då hela kretsen är på 7 nm. Visst kan det ge en begränsning om både CPU och GPU behöver dom 65 Watt'en samtidigt, men samtidigt så är ju lite av teorin bakom en APU att det är lite mot antingen eller.

Sen oneAPI är du inte ensam om att sätta förhoppningar till

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Datavetare
Skrivet av Bengt-Arne:

@Yoshman: eDram är väl en form av framebuffer catch, så det frigör bandbredd till det vanliga minnet. Lite av ett dubbelt win win, i form av eDram bandbredd + Minnes bandbredd.

Ryzen 7 4700G har ju ett större termiskt svängrum på 65W än vad U och H varianterna har, så det bör inte ge samma begränsning.
Är lite fel att jämföra med Radeon Pro WX 2100/3100 som jag har för mig är på 35 W (hela kortet, minne m.m.) så den inbyggda GPU'n bör ju inte ha större effektkrav då hela kretsen är på 7 nm. Visst kan det ge en begränsning om både CPU och GPU behöver dom 65 Watt'en samtidigt, men samtidigt så är ju lite av teorin bakom en APU att det är lite mot antingen eller.

Sen oneAPI är du inte ensam om att sätta förhoppningar till

Exakt hur eDRAM använd av Intel har varierat lite genom åren. Haswell/Broadwell använde det som en L4$ medan Skylake använde det som en RAM-buffert (helt osynligt för CPU, men GPU kan välja att låsa t.ex. Z-buffer i eDRAM). Sättet det används i Skylake har också används i vissa IBM POWER servers.

Den form av eDRAM som Intel använt har inte superhög bandbredd, i nivå med snabbt DDR4 dual-channel RAM. Stora skillnaden är att eDRAM kan vara dual-portat (vilket är fallet i Intels eDRAM lösning), så det går att skriva och läsa samtidigt med full hastighet i båda riktningar -> riktigt bra match för just Z-buffer men egentligen inte speciellt mycket bättre än RAM för texturer.

En annan vinst med eDRAM är att det kostar mindre energi att läsa/skriva mot eDRAM jämfört med RAM, det är en vinst för bärbara men rätt irrelevant för stationära.

Helt klart är TDP i stort ett icke-problem för stationära. Men för en stationär har jag lite svårt att se poängen med en "stark" APU/iGPU. Endera behöver du bara en GPU, vilken som helst, och då är det bortkastade transistorer med "stark" iGPU. Eller så behöver du rejält med GPU kraft och då skaffar man rimligen en dGPU då ligger i en helt annan liga. Börjar man blanda in saker som HBM med APU/iGPU blir det ju både dyrt och ändå inte lika snabbt p.g.a. problem att kyla paketet, Intel har ju gjort precis detta med Hades Canyon som hade Radon GPU med HBM hopklistrade med Intels "superlim" EMIB.

För bärbara finns aspekterna: tar mindre plats samt att GPGPU kan rejält skruva upp energieffektivitet på jobb. Att batteriet räcker så långe för t.ex. filmtittade på dagens bärbar är ju för att de nästan inte alls använder CPU utan kör avkodningen i GPU (i många fall till och med på fixed-function-HW som är än mer energieffektivt). Så där finns massor med anledningar att fila på GPU-prestanda hos den integrerade kretsen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Bengt-Arne:

En användare på TPU testade och fick nära på +30% prestandaökning.

30% prestandaökning i CPU-prestanda.
"Remember, you have to choose a CPU heavy game, and eliminate the bottleneck of the graphics card in order for the results to be comprehensible."

128MB EDRAM har inte bara väldigt mycket lägre bandbredd än ett normalt grafikminne, mängden minne räcker inte till något i texturväg i moderna spel. Fördelen med den lösningen är att det är rätt låg latens. Det blir helt enkelt precis som det kallas, en L4-cache. Vilket hjälper CPUn såklart, vilket förklarar varför 5775c var populär till spelmaskiner med riktigt grafikkort. Det kan hjälpa GPU med Z-Buffer med, det är ju trots allt det som det är till för. Men det kan inte på något sätt lösa bandbreddsproblemet för texturminne till AMDs APU:er.

EDIT: Såg nu att det mesta redan avhandlats bättre av Yoshman. Men men.

Permalänk
Medlem
Skrivet av Aleshi:

30% prestandaökning i CPU-prestanda.
"Remember, you have to choose a CPU heavy game, and eliminate the bottleneck of the graphics card in order for the results to be comprehensible."

128MB EDRAM har inte bara väldigt mycket lägre bandbredd än ett normalt grafikminne, mängden minne räcker inte till något i texturväg i moderna spel. Fördelen med den lösningen är att det är rätt låg latens. Det blir helt enkelt precis som det kallas, en L4-cache. Vilket hjälper CPUn såklart, vilket förklarar varför 5775c var populär till spelmaskiner med riktigt grafikkort. Det kan hjälpa GPU med Z-Buffer med, det är ju trots allt det som det är till för. Men det kan inte på något sätt lösa bandbreddsproblemet för texturminne till AMDs APU:er.

EDIT: Såg nu att det mesta redan avhandlats bättre av Yoshman. Men men.

Ja, men ändå så adresserar det den begränsade bandbredden till arbetsminnet, det som skrivs till/läses från eDram frigör ju bandbredd hos arbetsminnet.
Är ju rätt självfallet att eDram inte är avsett för texture

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!