AMD Ryzen får sex kärnor – toppmodellen går i upp till 4,0 GHz

Permalänk
Inaktiv
Skrivet av Enigma:

Du upprepar ofta saker som redan är konstaterat. Gällande denna saken fick du svar här:

#16635215

Kommer 6-core i samma frekvenser som quad så har du nog svaret själv.

Det är ändå inte svaret på min fråga då det kunde han varit 95w per kluster.
Du behöver inte vara så bitter, vi ska vara hjälpsamma och trevliga.

Permalänk
Medlem

Sas det inte att det bara skulle släppas med 4 och 8 kärnor?

Visa signatur

MSI X99A GODLIKE GAMING | i7-6950X 4.3GHz | 64GB RAM 3200MHz | RTX 2080

Nintendo Switch | PlayStation 5 | Xbox Series X

Min FZ Profil

Permalänk
Medlem
Skrivet av Enigma:

Kommer 6-core i samma frekvenser som quad så har du nog svaret själv.

Inte direkt då folk i tråden här säger att 2 kluster kommer vara sämre än 1.

Visa signatur

Asus Prime X370-Pro / AMD Ryzen 7 3700X / Corsair Vengeance LPX 32 GB DDR4 3000 CL15 / Asus Dual GeForce GTX 1070 OC (1912 MHz) / Fractal Design Define C / Cooler Master Hyper 212 Evo / EVGA SuperNOVA G2 650W ATX 80+ Guld

Permalänk
Datavetare
Skrivet av Aleshi:

I sammanhanget om man diskuterar om Ryzen är en octacore-krets eller inte så är det inte jämförbart. Ryzen är en octacorekrets. Hur kärnorna kommunicerar är inte helt relevant ur det perspektivet. Allra helst inte om någon vill fabulera ihop att TDPn ska multipliceras med två för att det skulle vara två quadcore kretsar, vilket det som sagt inte är.

Att TDP inte ska multipliceras med två är jag 100 % med på. Skrev däremot fel ovan! TDP är naturligtvis för hela paketet, inte bara för kretsen. Paketet kan innehålla flera kretsar, ett modernt exempel är t.ex. 5775C och C2Q är ett annat exempel med två kretsar i ett paket.

Ryzen är en både en octacore krets och en octacore CPU. Men C2Q är absolut också en quad-core CPU.

För oss som skriver prestandakritisk programvara som ska köras på många CPU-kärnor är det dock i vissa lägen en relevant skillnad på den logiska uppbyggnaden av kretsen. I både Windows (Win32) och Linux (sysfs) kan man därför få information kring hur olika CPU-kärnor hänger ihop i cache-hierarkin.

Ur den aspekten är t.ex. i7-6900K en åttakärnig CPU med två trådar per kärna, C2Q är två stycken dual-core ytan SMT medan SR7 är två quad-core med två trådar per kärna.

I de flesta fall kan man helt ignorera denna logiska skillnad, men i de specifika fall där det spelar roll är C2Q och SR7 två st separata delar, medan Phenom X4 och Core-serien är en sammansatt del.

I vissa fall är det svårt att göra speciellt mycket åt skillnaden ovan, men finns ändå en relevant påverkan för prestanda. Det vanligaste exemplet här är data som läses/skrivs från mer än en kärna. Sådant data måste skyddas på något sätt, typiskt med något form av lås. Kostnaden för att ta/släppa låset är kraftigt beroende av kommunikationslatens mellan kärnor, så blir viss asymmetri (västligt dyrare att ta låset om det senaste äges av en CPU-kärna i ett annat kluster).

Vilken annan relevant aspekt finns det än hur man måste agera när man vill köra sina program på kretsen? En CPUs enda uppgift är väl ändå att köra programvara?

Och viktigast: i de flesta fall spelar ovan ingen roll!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Hur är C2Q annorlunda? Det var mycket riktigt två dual-core kärnor, men precis som Ryzen låg de i samma krets
http://images.anandtech.com/doci/5174/Core%202%20Quad%20die.jpg

C2Q var en MCM och hade ingen annan interconnect än RAM (Intel hade helt enkelt inga andra alternativ). Zen är nativ och har point to point on-die. Infinity Fabric är alltså inte bara externa bussar som rör sig mellan olika controllers, utan också ett internt "mesh" i Zen-arkitekturen som det är officiellt sagt. Detta kan innebära att Zen (och Vega) har mycket sofistikerad interconnect och nödvändigtvis inte går via RAM på konventionellt vis. Får se närmare lansering eftersom AMD inte vill ge några som helst fler detaljer ang detta.

Skrivet av anon200632:

Det är ändå inte svaret på min fråga då det kunde han varit 95w per kluster.
Du behöver inte vara så bitter, vi ska vara hjälpsamma och trevliga.

Du skriver upprepningsvis "som har 2 cpuer i en" när det absolut så inte är fallet. Sen hur du kan spekulera om 95W TDP x 2 eller vart du fått det ifrån är för mig ett under... Är inte bitter men du greppar inte när man sagt ifrån tidigare i Zen tråden och tom citerar dig med ett svar. Jag är hjälpsam och trevlig.

Skrivet av Orber:

Inte direkt då folk i tråden här säger att 2 kluster kommer vara sämre än 1.

Vilka är folk? :S

Visa signatur

[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]

Permalänk
Medlem

Mycket intressanta inlägg av Yoshman och Enigma. Oerhört uppskattat från min sida.

Skickades från m.sweclockers.com

Permalänk
Inaktiv
Skrivet av Enigma:

C2Q var en MCM och hade ingen annan interconnect än RAM (Intel hade helt enkelt inga andra alternativ). Zen är nativ och har point to point on-die. Infinity Fabric är alltså inte bara externa bussar som rör sig mellan olika controllers, utan också ett internt "mesh" i Zen-arkitekturen som det är officiellt sagt. Detta kan innebära att Zen (och Vega) har mycket sofistikerad interconnect och nödvändigtvis inte går via RAM på konventionellt vis. Får se närmare lansering eftersom AMD inte vill ge några som helst fler detaljer ang detta.

Du skriver upprepningsvis "som har 2 cpuer i en" när det absolut så inte är fallet. Sen hur du kan spekulera om 95W TDP x 2 eller vart du fått det ifrån är för mig ett under... Är inte bitter men du greppar inte när man sagt ifrån tidigare i Zen tråden och tom citerar dig med ett svar. Jag är hjälpsam och trevlig.

Vilka är folk? :S

Kan inte säga än vart det kommer ifrån då jag vill se lite tester först.

Permalänk
Medlem
Skrivet av anon200632:

Kan inte säga än vart det kommer ifrån då jag vill se lite tester först.

TDP har inget att göra med om CPU'n är monolitisk eller inte. Specificerad effekt är för en hel SKU, dvs vad som sitter per socket. Har aldrig vart något annat heller. Zen är en monolitisk design med 8 kärnor, dvs 1 die, inget annat.

Visa signatur

[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]

Permalänk
Datavetare
Skrivet av Enigma:

Värt att tänka på är att Infinity Fabric inte bara är externa bussar som rör sig mellan olika controllers, utan också ett internt "mesh" i Zen-arkitekturen som det är officiellt sagt. Detta kan innebära att Zen (och Vega) har mycket sofistikerad interconnect och nödvändigtvis inte går via RAM på konventionellt vis. Får se närmare lansering eftersom AMD inte vill ge några som helst fler detaljer ang detta.

Finns några detaljer. "Infinity Fabric" är ett namn på en logisk standard för att koppla ihop olika delar, i praktiken är det HyperTransport 2.

Rent praktiskt måste det rimligen vara vissa skillnader i den elektriska designen beroende på om man kör Infinity Fabric internt på kretsen eller externt, utgår från att multi-socket Naples kör Infinity Fabric mellan sockets. Men det är samma logiska protokoll (vilket även är fallet för Intel Core, samma logiska protokoll över QPI som i ringen)

Internt löser Infinity Fabric exakt samma problem som t.ex. ARMs CoreLink CCI Cache Coherent Interconnect och Intels ring.

Naturligtvis går man inte direkt mot RAM, det gör inte heller CPUn i PS4/XBO, i multi-socket system som sitter ihop med QPI/HyperTransport eller i CoreLink CCI. Logiskt går man via RAM, praktiskt finns snabbvägar i interconnect, inget unikt med Infinity Fabric där.

Att det är ett mesh-nätverk är det normala, är Intel som skiljer sig här med sin ringdesign (som rent praktiskt är två ringar som går i olika riktningar). Intel hade faktiskt en mesh i Nehalem/Westmere, men ansåg att det inte praktiskt att skala en sådan design förbi sex kärnor då det blev allt för mycket ledningsbanor + den design Intel körde med användes bara mellan kärnor, i Nehalem/Westmere körde man QPI även på konsumentmodellerna till iGPU, PCIe och sydbrygga.

Och några detaljer verkar man gett, t.ex. om bandbredd

The bandwidth will scale from 30-50 GB/s for notebooks and around 512 GB/s for Vega GPU.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av Enigma:

C2Q var en MCM och hade ingen annan interconnect än RAM (Intel hade helt enkelt inga andra alternativ). Zen är nativ och har point to point on-die.

Det mest tidskritiska är cache-koherens trafiken, den går aldrig via RAM så även C2Q kopplade ihop de två delarna direkt på något sätt, d.v.s. en kortare väg än att gå via RAM. Gissar att vad man gör i PS4/XBO är rätt likt det man gjorde i C2Q.

Huruvida data måste gå via RAM eller om det finns någon form av forwarding-logik vet jag inte då jag aldrig ägt en C2Q. Vid läsning vore det ju ändå rätt naturligt att bara skicka data direkt från L2$ till den andra delens L2$, annars blir tillståndet S (cacheline shared) rätt meningslöst.

Nu är garanterat latensen lägre i Ryzen än C2Q då det ändå är rätt många år senare. Men PS4/XBO designen är inte såå gammal och där är det trots allt ~20 cykler latens inom ett kluster och ~180 cykler mellan kluster. Lär ju alla fall vara >100 cykler även i Ryzen medan L3 latensen borde ligga några heltalsfaktorer lägre.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Inaktiv
Skrivet av Yoshman:

Det mest tidskritiska är cache-koherens trafiken, den går aldrig via RAM så även C2Q kopplade ihop de två delarna direkt på något sätt, d.v.s. en kortare väg än att gå via RAM. Gissar att vad man gör i PS4/XBO är rätt likt det man gjorde i C2Q.

Huruvida data måste gå via RAM eller om det finns någon form av forwarding-logik vet jag inte då jag aldrig ägt en C2Q. Vid läsning vore det ju ändå rätt naturligt att bara skicka data direkt från L2$ till den andra delens L2$, annars blir tillståndet S (cacheline shared) rätt meningslöst.

Nu är garanterat latensen lägre i Ryzen än C2Q då det ändå är rätt många år senare. Men PS4/XBO designen är inte såå gammal och där är det trots allt ~20 cykler latens inom ett kluster och ~180 cykler mellan kluster. Lär ju alla fall vara >100 cykler även i Ryzen medan L3 latensen borde ligga några heltalsfaktorer lägre.

Men detta är inget man kommer märka i lagg eller något annat konstigt?

Permalänk
Medlem
Skrivet av Enigma:

TDP har inget att göra med om CPU'n är monolitisk eller inte. Specificerad effekt är för en hel SKU, dvs vad som sitter per socket. Har aldrig vart något annat heller. Zen är en monolitisk design med 8 kärnor, dvs 1 die, inget annat.

Ja precis, TDP är först och främst för att kunna dimensionera kylare. Och man har ju inte en kylare för varje kärna utan en kylare per socket. Sen hur många chip eller hur de sitter under heatspreader är egentligen orelevant.

Permalänk
Medlem
Skrivet av anon159643:

Detta med 6 core var det jag trodde hela tiden, sedan kan det vara så att det ej ekonomisk lönsamt att göra, men det är en annan femma. - Väldigt få 8 core med trasig kärna, ihop med lite arbete.

Jag är ganska övertygad om att det kommer finnas 2, 4, 6 och 8 kärniga varianter. "Arbetet" är insignifikant. "Vanligtvis" med AMD så bryr man sig inte ens om att skära bort chippens ledningsbanor med laser, utan man gör det i mjukvara, eller på PCB't man monterat kislet på. Något som automatiseras till 100% och var chippen hamnar bestäms när de funktionstestas. Man ökar lönsamheten, inte minskar, så det är ren vinst.

Skrivet av anon159643:

De pratades om att AMD ska klocka sig själv, men det handlar väl om att moderkortet gör detta om den är satt till detta. Och då kan man kanske se 4Ghz som minsta toppfrekvens med vettig kylare.

Moderkort, CPU, "BIOS" och OS. Allt ska samarbeta för att det ska fungera. Ingen enskild enhet kan egentligen ta åt sig äran för det där.

Skrivet av ronnylov:

Kanske kommer det att gå att låsa upp 6-kärniga till 8-kärniga med något specialbios?

Med AMD brukar man inte behöva någon specialare. De senaste generationerna där det varit möjligt har helt enkelt haft en väljare i BIOS för att aktivera alla, enskilda, eller bara default, kärnor. Tidigare än så behövde man en blyertspenna. AMD har varit "snälla" på det viset.

Skrivet av Yoshman:

Det sagt: hoppas verkligen att den fyrkärniga Ryzen blir en egen krets med en CCX och inte samma krets som den 8-kärniga med två kärnor avslagna i varje CCX. Kostnaden att kommunicera mellan kärnor i samma CCX är lägre än mellan kärnor i olika CCX. Hur stor skillnaden blir vet vi inte än, men är 100 % säkert att det finns en skillnad och latens kommer skilja flera heltalsfaktorer.

Jag tror att det är helt avgörande hur hög felfrekvens de har på kärnorna. Är den hög, får vi CPU'er med 1x2 och 2x2 setup, är den låg tillverkar de ett eget chip för 2 och 4 kärniga alternativ.

Skrivet av anon200632:

Tänkte då det ser ut att vara så himla många faser på Ryzen moderkorten, det behövs ju ej om cpun bara skulle dra 95W

Fast nu säger egentligen inte antalet faser speciellt mycket om effekten. Det är inte speciellt mycket svårare att göra en drivkrets för 50w än en för 25, osv. Däremot blir kvalitén på drivspänningen mycket lättare att hålla hög, med många små faser kontra ett fåtal spänningsstarka.

Skrivet av Yoshman:

I Zen är minsta byggblocket en CCX, den råkar bestå av fyra kärnor. Det kommer finnas Ryzen-kretsar med en CCX, om inte annat i APUer och mobila enheter. Den 8-kärniga varianten består av två fyra kärniga block som är ihopkopplade med "Inifinity Fabric" (närmaste motsvarigheten på Core är QPI).

Frågan jag har är väll närmast hur långt AMD kan skala det här. 1, 2, 4'a CCX'er? 16 kärnor Opteron, 32 trådar? Då snackar vi helt plötsligt högre TDP, men det är det kanske värt. De behöver slå sig in på server marknaden med, inte bara i form av lågenergialternativ, och om det går att skala vertikalt på det viset, är det en möjlighet som står till buds. Dock undrar jag om inte det i så fall finns risk för att det blir två fysiska chip som man klistrar ihop. Frågan är vad man ska använda för klister...
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Datavetare
Skrivet av anon200632:

Men detta är inget man kommer märka i lagg eller något annat konstigt?

Hur ofta hörde du det klagomålet från C2Q ägare? Rätt säker att det är ett icke-problem i en förkrossande majoritet av fallen. Samma sak kommer garanterat gäller för Ryzen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Att TDP inte ska multipliceras med två är jag 100 % med på. Skrev däremot fel ovan! TDP är naturligtvis för hela paketet, inte bara för kretsen. Paketet kan innehålla flera kretsar, ett modernt exempel är t.ex. 5775C och C2Q är ett annat exempel med två kretsar i ett paket.

Ryzen är en både en octacore krets och en octacore CPU. Men C2Q är absolut också en quad-core CPU.

För oss som skriver prestandakritisk programvara som ska köras på många CPU-kärnor är det dock i vissa lägen en relevant skillnad på den logiska uppbyggnaden av kretsen. I både Windows (Win32) och Linux (sysfs) kan man därför få information kring hur olika CPU-kärnor hänger ihop i cache-hierarkin.

Ur den aspekten är t.ex. i7-6900K en åttakärnig CPU med två trådar per kärna, C2Q är två stycken dual-core ytan SMT medan SR7 är två quad-core med två trådar per kärna.

I de flesta fall kan man helt ignorera denna logiska skillnad, men i de specifika fall där det spelar roll är C2Q och SR7 två st separata delar, medan Phenom X4 och Core-serien är en sammansatt del.

I vissa fall är det svårt att göra speciellt mycket åt skillnaden ovan, men finns ändå en relevant påverkan för prestanda. Det vanligaste exemplet här är data som läses/skrivs från mer än en kärna. Sådant data måste skyddas på något sätt, typiskt med något form av lås. Kostnaden för att ta/släppa låset är kraftigt beroende av kommunikationslatens mellan kärnor, så blir viss asymmetri (västligt dyrare att ta låset om det senaste äges av en CPU-kärna i ett annat kluster).

Vilken annan relevant aspekt finns det än hur man måste agera när man vill köra sina program på kretsen? En CPUs enda uppgift är väl ändå att köra programvara?

Och viktigast: i de flesta fall spelar ovan ingen roll!

Och t.ex. Llano? Är det fyra single cores? De kommunicerar inte via cache.
Förstår du varför det är kontraproduktivt att måla upp det som 2 quadcores när folk genast tror att det kommer lagga?
Jag har försökt säga att i detta sammanhanget är kopplingen irrelevant. Man vill beskriva det som två kretsar, man försöker få det till att det ska bli dubbel TDP och lagg. Folk greppar efter halmstrån för att försöka vrida ickefrågor till något negativt.

Permalänk
Datavetare
Skrivet av -=Mr_B=-:

Frågan jag har är väll närmast hur långt AMD kan skala det här. 1, 2, 4'a CCX'er? 16 kärnor Opteron, 32 trådar? Då snackar vi helt plötsligt högre TDP, men det är det kanske värt. De behöver slå sig in på server marknaden med, inte bara i form av lågenergialternativ, och om det går att skala vertikalt på det viset, är det en möjlighet som står till buds. Dock undrar jag om inte det i så fall finns risk för att det blir två fysiska chip som man klistrar ihop. Frågan är vad man ska använda för klister...
B!

AMD har väl redan ES med 8 CCX, d.v.s. 32 kärnor och 64 trådar? TDP kan man hålla på en rimligt nivå genom att sänka frekvensen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Inaktiv
Skrivet av Yoshman:

Hur ofta hörde du det klagomålet från C2Q ägare? Rätt säker att det är ett icke-problem i en förkrossande majoritet av fallen. Samma sak kommer garanterat gäller för Ryzen.

Härligt

Permalänk
Medlem
Skrivet av -=Mr_B=-:

Med AMD brukar man inte behöva någon specialare. De senaste generationerna där det varit möjligt har helt enkelt haft en väljare i BIOS för att aktivera alla, enskilda, eller bara default, kärnor. Tidigare än så behövde man en blyertspenna. AMD har varit "snälla" på det viset.

Använde man inte blyertspennan för att låsa upp FSB'n så man kunde överklocka? Har för mig det var det jag gjorde på min Thunderbird för att få upp den från 700 eller 750 MHz till runt 900 MHz. Har man behövt göra det för att låsa upp kärnor också?

Hur som så var det tider det!

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360.
DATOR 2011 års modell: Underbara Sandy Bridge, i7 2600K@4,7 GHz på ett P67 Sabertooth-bräde. Radeon HD 7770

Permalänk
Datavetare
Skrivet av Aleshi:

Och t.ex. Llano? Är det fyra single cores? De kommunicerar inte via cache.
Förstår du varför det är kontraproduktivt att måla upp det som 2 quadcores när folk genast tror att det kommer lagga?
Jag har försökt säga att i detta sammanhanget är kopplingen irrelevant. Man vill beskriva det som två kretsar, man försöker få det till att det ska bli dubbel TDP och lagg. Folk greppar efter halmstrån för att försöka vrida ickefrågor till något negativt.

Nej, Llano är naturligtvis en fyrkärnig krets. Det är exakt samma kommunikationslatens mellan alla kärnor och det är vad som spelar roll.

Specifikt för Llano är ju att inga kärnor delar cache så den kretsen kommer vara rätt kass på uppgifter där kärnor relativt ofta måste synkronisera data, men den är konsekvent kass.

Asymmetri är alltid svårt att hantera på ett optimalt sätt i programvara.

C2Q verkar inte haft problem speciellt ofta från sin design (då det är Intel hade vi läst spaltmeter om eventuellt strul), så finns ingen anledning att anta att Ryzen kommer få sådana problem. Kommer garanterat finns specialfall som ställer till det, men dessa fall kommer vara väldigt ovanliga.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Aleshi:

Vilken hemmamod gjorde du för att pumpa upp IPCn mer än 50%, lägga till två kärnor och samtidigt sänka TDP till 95W inklusive SoC-del?

6 kärnor i 4ghz mena jag om det inte var uppenbart dessutom är IPCn 40% inte mer än 50% vet inte vart du har fått dina siffror

Visa signatur

Ny dator Lexius signatur 2018 edition Ryzen 7 2700X@4.35PBO/Vega 64 Nitro+/16 GB DDR4 Patriot Viper4 2866mhz/ ASUS B450 F-Gaming/ 500GB samsung 970 evo m.2ssd / 2TB SSHD/1TB WD BLUE 7200rpm/WD Black TB/1TB SSHD (AMD StoreMi)PSU Be quiet pure power 730W / Mobo Asus B 450 F-Gaming/Hörlurar Sennhieser 58X Mobil Samsung Galaxy S20FE 5G 256GB/8GB Ram Skärm Asus TUF Gaming 144HZ IPS Async

Permalänk
Medlem
Skrivet av Yoshman:

AMD har väl redan ES med 8 CCX, d.v.s. 32 kärnor och 64 trådar?

Ingen aning. Har de det, är det en bra utveckling.

Skrivet av Yoshman:

TDP kan man hålla på en rimligt nivå genom att sänka frekvensen.

Nja... Nä. En 64 trådars CPU med låg frekvens kan vara riktigt rätt för vissa extremt mångtrådade laster, men då är det nog rätt att släppa en version med hälften så många kärnor, och dubbla klockfrekevensen, Det är ju det där med förluster när man ökar antalet kärnor, så "de flesta" laster kommer se bättre prestanda med den senare. Det finns garanterat scenarion där fler trådar är mer rätt, men det är nog mer ovanligt. Så, både och får gärna se dagens ljus.
Om man å andra sidan kan klara sig med att sänka frekvensen 25% och fördubbla antalet kärnor, är utgångsläget annorlunda. Det beror helt enkelt på hur mycket man måste sänka, för att få energiförbrukningen under kontroll. Jag hör ju till skolan som helst vill skrota alla flerkärniga CPU'er och ersätta dem med enkärniga enheter med en multipel av de flerkärnigas frekvens. En enkärnig 18gHz 2500K hade jag varit nöjd med.
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Skrivet av Lexius:

Ryzen har uppnått det jag har haft i snart 7 år bra jobbat AMD!

(Ja kolla citatet så fattar du)

Vilket citat?

Permalänk
Medlem
Skrivet av Yoshman:

Det mest tidskritiska är cache-koherens trafiken, den går aldrig via RAM så även C2Q kopplade ihop de två delarna direkt på något sätt, d.v.s. en kortare väg än att gå via RAM. Gissar att vad man gör i PS4/XBO är rätt likt det man gjorde i C2Q.

Huruvida data måste gå via RAM eller om det finns någon form av forwarding-logik vet jag inte då jag aldrig ägt en C2Q. Vid läsning vore det ju ändå rätt naturligt att bara skicka data direkt från L2$ till den andra delens L2$, annars blir tillståndet S (cacheline shared) rätt meningslöst.

Nu är garanterat latensen lägre i Ryzen än C2Q då det ändå är rätt många år senare. Men PS4/XBO designen är inte såå gammal och där är det trots allt ~20 cykler latens inom ett kluster och ~180 cykler mellan kluster. Lär ju alla fall vara >100 cykler även i Ryzen medan L3 latensen borde ligga några heltalsfaktorer lägre.

Hur mycket kommer spel påverkas av detta i Ryzen? Från vad jag har läst i dina tidigare inlägg om CPUn i Xbox One/PS4 så har det varit två kluster med fyra kärnor vardera där kommunikation mellan kärnor utanför samma kluster dyrt. Från vad jag förstod betydde det att de flesta av beräkningarna gjordes av fyra kärnor i samma kluster medan resterande 2-3 kärnor (som var lediga) fick arbeta med saker som inte hade mycket med spelfysiken att göra.

Kommer detta leda till att de flesta spel drar nytta av bara fyra kärnor (åtta trådar med SMT) i ett CCX när det kommer till beräkningar? Finns ju spel som skalar med fler än åtta trådar varav jag undrar om de kan uttnytja de extra trådarna i 6- och 8-kärniga Ryzen. För diskussionens skull bortser vi från frekvensskillnader mellan 4-, 6-, och 8-kärniga Ryzen och antar de körs i samma frekvens.

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Permalänk
Medlem
Skrivet av Yoshman:

Hur är C2Q annorlunda? Det var mycket riktigt två dual-core kärnor, men precis som Ryzen låg de i samma krets
http://images.anandtech.com/doci/5174/Core%202%20Quad%20die.jpg

Precis som C2Q så är kommunikationslatensen mellan de två delarna högre än mellan kärnor inom samma kluster. Så ur den synpunkten är både C2Q, Ryzen och även CPU-delen i PS4/XBO två kluster av kärnor som sitter på samma krets.

Vet inte om folk tolkar det som något dåligt, men var ju inte så att C2Q i praktiken var sämre än samtida Phenom X4 där det var samma kommunikationslatens mellan alla kärnor.

I Zen är minsta byggblocket en CCX, den råkar bestå av fyra kärnor. Det kommer finnas Ryzen-kretsar med en CCX, om inte annat i APUer och mobila enheter. Den 8-kärniga varianten består av två fyra kärniga block som är ihopkopplade med "Inifinity Fabric" (närmaste motsvarigheten på Core är QPI).

I Core är minsta byggblocket en "agent" på den ringbuffer som kopplar ihop de interna delarna.
https://www.pcper.com/files/imagecache/article_max_width/review/2014-09-07/slides10.jpg
I praktiken har man valt att göra tre konfigurationer för E-serien/Xeon E5/Xeon E7, dessa kallas HCC, MCC och LCC (High/Medium/Low Core Count).

Alla modeller ur E-serien är LLC, så alla dessa kretsar har lika många transistorer. För Broadwell har LLC 10 kärnor/L3-cache agenter, men de mindre modellerna har vissa kärnor/L3-cache agenter avstängda.

Fördelen med Ryzen är att den modellen rimligen gör det billigare att designa varje specifik krets. Nackdelen är en viss asymmetri vilket normalt är irrelevant för program som skalar perfekt med CPU-kärnor men har en viss negativ påverkan på program som har relativt mycket kommunikation mellan kärnor.

Fördelen med Core är att man slipper kraftig asymmetri i kommunikationslatens mellan kärnor på samma krets samt att granulariteten är en enda kärna. Nackdelen är att det blir dyrare att designa varje given konfiguration, så även fast man har full flexibilitet är det inte ekonomiskt vettigt att göra allt för många konfigurationer.

Och självklart gäller TDP på hela kretsen, det oavsett hur den är logiskt sammansatt.

Skrivet av Yoshman:

Inte jämför tillverkningsmässigt, är enklare/billigare att göra två separata kretsar och sätta dem i samma paket.

Däremot helt jämförbart logiskt då FSB satt på moderkortet på den tiden så var praktiskt möjligt att ha två separata kretsar ihopsatt på det sättet.

C2D: par om två kärnor med delad L2, mellan dessa får man kommunicera via FSB, d.v.s. ej via cache-systemet vilket ger klart högre latens. Alla kärnorna är dock ändå cache-koherenta med varandra, så går självklart att kommunicera mellan alla kärnor via RAM.

Ryzen: par om fyra kärnor med delad L3, mellan dessa får man kommunicera via Infinity Fabric, d.v.s. ej via cache-systemet. Alla CCX är dock cache-koherenta (via Infinity Fabric) och kan därför kommunicera med varandra via RAM.

Så ser inte riktigt var det finns en relevant skiljelinje på logisk nivå och därmed på programvaruteknisk nivå.

Om man kunde lägga varje kärna i en separat krets och sedan sy ihop dem i samma paket med väldigt låg latens skulle det ju vara über-designen då det vore den billigaste och mest flexibla. Nu går det tyvärr inte, ljuset hastighet är inte snabbt nog

Skrivet av Yoshman:

Hur ofta hörde du det klagomålet från C2Q ägare? Rätt säker att det är ett icke-problem i en förkrossande majoritet av fallen. Samma sak kommer garanterat gäller för Ryzen.

Skrivet av Yoshman:

Nej, Llano är naturligtvis en fyrkärnig krets. Det är exakt samma kommunikationslatens mellan alla kärnor och det är vad som spelar roll.

Specifikt för Llano är ju att inga kärnor delar cache så den kretsen kommer vara rätt kass på uppgifter där kärnor relativt ofta måste synkronisera data, men den är konsekvent kass.

Asymmetri är alltid svårt att hantera på ett optimalt sätt i programvara.

C2Q verkar inte haft problem speciellt ofta från sin design (då det är Intel hade vi läst spaltmeter om eventuellt strul), så finns ingen anledning att anta att Ryzen kommer få sådana problem. Kommer garanterat finns specialfall som ställer till det, men dessa fall kommer vara väldigt ovanliga.

Kanske inte skulle citerat allt du skrivit, men nu är det där.

Nu var det längesedan och jag har inga länkar på lager och har inte lust att Googla och läsa en timme, men jag minns väldigt väl att Core 2 Quad var en "mixed bag", för FSB:n var en flaskhals som gjorde att en del flertrådade saker gick sämre än motsvarande Core 2 Duo. AMD:s HyperTransport var mycket bättre och så hade ju deras CPU:er sedan Athlon 64 inbyggd minneskontroller och fick därför inte alls samma negativa effekter av att vara en MCM. Men på den tiden så var flertrådade applikationer ännu rätt exotiskt, så Intel "klarade" sig i praktiken, och folk sket i vilket för det var ju en Core 2 Quad!!!!1!!1!1111one.

Skrivet av Lexius:

6 kärnor i 4ghz mena jag om det inte var uppenbart dessutom är IPCn 40% inte mer än 50% vet inte vart du har fått dina siffror

AMD:s VD Lisa Su sade på New Horison-presentationen att de hade överskridit sitt mål på 40% IPC-ökning mot Excavator, och Excavator är trots allt lite bättre än Phenom II i IPC, så 50%+ är inget tokigt påstående.

Visa signatur

Räkna ut hur kraftigt nätaggregat du behöver på OuterVision Power Supply Calculator. 500W räcker för de allra flesta vanliga system. Seasonic är bäst. ;) – Elektrostatisk urladdning är ett verkligt problem.
"People who are serious about software should make their own hardware" – Alan Kay
Bojkotta maffian

Permalänk
Medlem
Skrivet av Hoggaforfan:

Vilket citat?

Ganska säker på att det är signaturen som åsyftas i detta fall, men vill minnas att någon annan punkterade påståendet ganska rejält med.

Permalänk
Datavetare
Skrivet av FishTank:

Hur mycket kommer spel påverkas av detta i Ryzen? Från vad jag har läst i dina tidigare inlägg om CPUn i Xbox One/PS4 så har det varit två kluster med fyra kärnor vardera där kommunikation mellan kärnor utanför samma kluster dyrt. Från vad jag förstod betydde det att de flesta av beräkningarna gjordes av fyra kärnor i samma kluster medan resterande 2-3 kärnor (som var lediga) fick arbeta med saker som inte hade mycket med spelfysiken att göra.

Kommer detta leda till att de flesta spel drar nytta av bara fyra kärnor (åtta trådar med SMT) i ett CCX när det kommer till beräkningar? Finns ju spel som skalar med fler än åtta trådar varav jag undrar om de kan uttnytja de extra trådarna i 6- och 8-kärniga Ryzen. För diskussionens skull bortser vi från frekvensskillnader mellan 4-, 6-, och 8-kärniga Ryzen och antar de körs i samma frekvens.

Finns en gigantisk ocean mellan PS4/XBO fallet och en PC med Ryzen: den förra är extermt begränsad av sin CPU-kraft, det verkar vara den primära flaskhalsen i rätt många lägen.

En spel-PC med SR7 kommer i princip aldrig vara CPU-begränsad idag och med väldigt stor sannolikhet inte heller de närmaste åren.

Undrar om inte många blivit lite blinda av alla tester som gjorts på många teknikwebbplatser där man testat effekten av snabbare RAM och effekten av olika antal kärnor i en rad spel. Ja, det finns en skillnad när man kör med GTX 1080 / Titan X i 1920x1080 eller lägre.

Men tar man ett steg tillbaka och tittar på hur det ser ut med konfigurationer och inställningar som är representativt för vad som faktiskt används så är det i praktiken ingen skillnad för spel om man sitter på en i5:a eller i7-6950X, CPU-delen är inte den primära flaskhalsen.

Så Ryzen kommer ha samma egenskap att kommunikation blir relativt dyrt mellan kluster precis som hos PS4/XBO.

I praktiken nästan alltid betyder "kommunikation" här någon form av synkronisering i multitrådade program, vilket betyder att program som skalar i princip perfekt med kärnor inte kommer ha något problem alls då ett krav för att de ska skala så väl är att det finns ingen eller nästan ingen kommunikation mellan kärnorna.

Spel kommer inte påverkas då de knappast kommer behöva mer än 4C/8T inom överskådligt tid. I absolut värsta fall kan man som Ryzen ägare då bara låsa ner spelet på en CCX, men är väldigt nära 100 % säker att det aldrig kommer vara relevant att göra i praktiken.

Skrivet av GilbertG:

Kanske inte skulle citerat allt du skrivit, men nu är det där.

Nu var det längesedan och jag har inga länkar på lager och har inte lust att Googla och läsa en timme, men jag minns väldigt väl att Core 2 Quad var en "mixed bag", för FSB:n var en flaskhals som gjorde att en del flertrådade saker gick sämre än motsvarande Core 2 Duo. AMD:s HyperTransport var mycket bättre och så hade ju deras CPU:er sedan Athlon 64 inbyggd minneskontroller och fick därför inte alls samma negativa effekter av att vara en MCM. Men på den tiden så var flertrådade applikationer ännu rätt exotiskt, så Intel "klarade" sig i praktiken, och folk sket i vilket för det var ju en Core 2 Quad!!!!1!!1!1111one.

Fast att FSB:n var en flaskhals och att det finns en effekt av att ha två kluster med kärnor med relativt hög kommunikationslatens är två helt separata problem!

FSB var absolut en flaskhals då den gav högre latens och något lägre effektiv bandbredd med en viss typ minnen jämfört med att ha en integrerad minneskontroller. Men det är ett problem vare sig man kör en kärna eller fyra kärnor, latensen är typiskt ett större problem i enkeltrådade fall medan bandbredden absolut är ett större problem när alla kärnor jobbar.

Än idag harvas Cinebench i CPU-tester, så här såg det ut på C2Q tiden:

Ett test där man jämför 1, 2 och 4 trådar aktiv

Dold text

Skalningen från en till fyra kärnor är inom några procent mellan AMD Phenom (som har en symmetrisk design) och Intel C2Q (som har två dual-core kluster). Phenom är den som skalar lite bättre, men skillnaden är irrelevant då ingen skulle märka den i ett blindtest.

Och för C2Q skulle jag säga detta är det största problemet, minnesbandbredd!

Dold text

Har som sagt aldrig haft en C2Q (hade en Phenom X4 9750 under denna period), men notera att de fyra kärnorna fick samsas om runt 5 GB/s medan Phenom X4 pressade ut 6-6,5 GB/s.

Jämför det med t.ex. i7-2600K, som nog inte är dubbelt så snabb som t.ex C2Q 9300, som har över 20 GB/s även med 1333 MHz DDR3. D.v.s. bandbredd än fyra gånger högre fast CPU-kärnorna är som mest dubbelt så hungriga på data.

Du kan läsa hela testet här, finns inte ett enda fall där saker som faktiskt kan utnyttja många CPU-trådar går bättre på C2D än på C2Q.

Däremot är det helt sant att C2D var i praktiken ett mycket bättre köp för väldigt nära 100 % av användarna. Men det berodde på att, precis som idag, majoriteten av programvaran som körs på skrivbordet ser långt större nytta av högre prestanda per CPU-kärna än av flera CPU-kärnor.

C2D var rätt mycket högre klockad än C2Q, framförallt om man bekymrade sig om prislappen. Men exakt samma sak gäller idag, titta SweC test av i7-7700K. Är ditt mål att spela är det totalt pengarna i sjön att köpa E-serien över i7-7700K.

8-kärniga Ryzen och E-serien har absolut användningsområden och kommer vara lysande produkter för rätt publik. Den publiken är dock inte PC-gamers.

Notera dock att för Ryzen verkar den högst klockade modellen (enligt rykten) ha 8C/16T. Min åsikt är och lär förbli att för entusiaster som värdesätter faktiskt prestanda över allt annat så kommer det nästan alltid vara bäst att välja den modell med högst enkeltrådprestanda, om det sedan sitter fyra, sex eller åtta kärnor i den är sekundärt i en klar majoritet av fallen!

Undantag finns naturligtvis, men de är just undantag. Transcoding sker idag mer effektivt med QuickSync än E-serien, rendering sker idag snabbare på GPUer än på CPUer (och problemet med VRAM-storlek är löst i Pascal och kommer lösa sig i Vega).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Undantag finns naturligtvis, men de är just undantag. Transcoding sker idag mer effektivt med QuickSync än E-serien, rendering sker idag snabbare på GPUer än på CPUer (och problemet med VRAM-storlek är löst i Pascal och kommer lösa sig i Vega).

Jag kunde inte låta bli att inflika att detta har AMD redan löst med Radeon Pro SSG i Juli förra året, 1TB SSD kopplad till GPU för att komma förbi för lite VRAM.

https://www.extremetech.com/extreme/232416-amd-announces-new-...

Visa signatur

Rʏᴢᴇɴ 5800X3D / Tᴀɪᴄʜɪ X570 / 64Gʙ DDR4/ RX 6950XT Mᴇʀᴄʜ 319

Permalänk
Medlem
Skrivet av Vangen:

Sas det inte att det bara skulle släppas med 4 och 8 kärnor?

Det var ett elakt rykte som startades av zolkorn.com samt att priserna skulle bli mycket högre än vad folk siat om,

http://wccftech.com/amd-ryzen-processor-6-core-model-700-usd-...

Detta i sin tur slogs det hål i av en finsk sajt någon dag efter samt att flera andra bekräftat med sina olika källor som Videocardz,

https://videocardz.com/65654/amd-ryzen-6-core-cpu-exists

Visa signatur

Rʏᴢᴇɴ 5800X3D / Tᴀɪᴄʜɪ X570 / 64Gʙ DDR4/ RX 6950XT Mᴇʀᴄʜ 319

Permalänk
Datavetare
Skrivet av TurboFreak68:

Jag kunde inte låta bli att inflika att detta har AMD redan löst med Radeon Pro SSG i Juli förra året, 1TB SSD kopplad till GPU för att komma förbi för lite VRAM.

https://www.extremetech.com/extreme/232416-amd-announces-new-...

Visst, det är ett sätt att lösa det.

Pascal/Vega löser det än mer elegant i att de kan direkt mappa in "vanligt" RAM direkt till GPUn. Rent tekniskt är det möjligt tidigare (i alla fall Kepler och senare kan det), men innan Pascal/Vega var man då tvungen att låsa ner RAM så det inte kan användas till något annat.

Pascal/Vega har virtuellt minne likt CPUer, d.v.s. är möjligt att mappa på/av mer fysiskt minne (som rent praktiskt även kan vara swap) helt dynamiskt. Blender har stöd för detta i sin CUDA-render sedan sommaren 2016.

Detta är naturligtvis inte lika snabbt som att köra helt ur VRAM, men tittar man t.ex. på Blender demo för Ryzen så är redan GTX 1060 runt 2,5 gånger snabbare än Ryzen/i7-6900K. Så ska mycket till innan CPU-delen blir snabbare!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer