Permalänk
Medlem
Skrivet av Ratatosk:

Byggde ihop min, skulle starta, helt jävla dött, nätagget gick inte i gång, skall testa med ett äldre men orkar inte mer i dag.

Ryzen kräver extra pins för cpu ju

Skickades från m.sweclockers.com

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Medlem
Skrivet av marcusOCZ:

Nu får du ge dig va?

Om en del spel ger upp till 80-90% mer prestanda i SLI mot ett kort i 1440p eller allra helst 4k, klart det tar bort gpu som flaskhals?

Och en del spel ger 0-10% mer prestanda. Har du kört dubbla kort någon gång eller?

Poängen kvarstår fortfarande att det skulle inte förändra något förutom att införa en GPU bottleneck eller göra så att siffrorna ser närmare ut men är procentuellt samma.

Permalänk
Hjälpsam
Skrivet av SectionX2:

Ryzen kräver extra pins för cpu ju

Skickades från m.sweclockers.com

Tack för tipset men åtta CPU-pins är redan inkopplade.
Tror att det är nätagget eller moderkortet.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem

@marcusOCZ:

check this out

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Medlem
Skrivet av sAAb:

Ja det finns några hmm ang virtualiseringssupport ännu, men jag uppfattar ACS i första hand som en Intel-issue. Det är inget som jag behövt hantera på Opteron 61xx, jag skickar bara in en GPU och dess HDMI-ljudport som två olika pci-devices, t.ex. @ddelin skrev också tidigare att Bulldozer med efterföljare inte haft samma problem som Intel med detta. En resevation här är att jag inte riktigt förstått problemet, men för mig har det alltid varit ett ickeproblem då jag aldrig virtualiserat hårdvara på Intel. Så jag ser ingen aledning att vänta bekymmer med just detta på Ryzen, men vi vet ju inte förrän vi ser det testat.

(tack för förevisningen av robusta regressionsmetoder förresten, jag har inte haft tillfälle att kommentera det än.)

UPDATE: Hittar tecken på att ACS faktiskt kan vara ett problem på Ryzen:
https://forums.anandtech.com/threads/ryzen-strictly-technical...

Hinner inte följa upp i helgen. Men det är bra att det finns folk som testar.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Permalänk
Medlem

http://wccftech.com/ryzen-7-1800x-overclocked-58ghz-ln2/

Bortsett ifrån den exotiska kylningen osv. Så har ju AMD faktisk lyckats ganska bra med sin processor.

Permalänk
Medlem
Skrivet av Ratatosk:

Tack för tipset men åtta CPU-pins är redan inkopplade.
Tror att det är nätagget eller moderkortet.

va hade du för nättagg? Kör på Fractal Design Tesla 800w

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Hjälpsam

Köpte ett Bitfenix 750W Whisper från Inet.
http://www.sweclockers.com/test/23247-bitfenix-whisper-m-750-...
Har ett Cooler Master 700W (V 700 tror jag), inkopplad i min gamla dator, tänker testa med det i morgon.
https://www.komplett.se/product/791771?gclid=CLvLxYSWvdICFQfP...

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem
Skrivet av Gainsgoblin:

@PalmiNio: men nej för helvete inte det här igen. Joker är en idiot och testade med en gpu bottleneck.

Han testade som.många spelar, menar du? Bra fråga om det är teoretisk prestanda eller praktisk prestanda som räknas. Det är lite som att försöka besvara frågan om vilket det bästa grafikkortet är genom att titta på TFLOPS. Det är ingen som hävdar att det är fel att testa flera olika upplysningar där. Skall vi föra samma argumentation när 1080ti testas? Varför testa i 1080p? Det är ju CPU-bundet enligt alla förstå-sig-påare som har en åsikt om CPU-testning.

Vad gäller ni driver till windows, Det finns tydligen skäl att tro att MS gjort bort sig lite.

Igen.

När missade de drivrutiner till en Intel-release senast? Jag vet när det hände AMD senast iaf...

Permalänk
Medlem

@Gruarn: Orkar inte förklara så titta på den här istället.
https://www.youtube.com/watch?v=i2lNWzC1tkk

Permalänk
Datavetare
Skrivet av sAAb:

Det där är rent tyckande.

Ryzen har en IPC på nivån för Haswell/Broadwell, ned till en tredjedel av priset.

Med tanke på hur en modern high-end x86 är konstruerad får man nog dela in IPC i fyra klasser

  1. i huvudsak flertrådade spel, tex BF1 och Overwatch 2

  2. i huvudsak enkeltrådade spel, tex Pong, Tetris och GTA V

  3. parallella beräkningar, t.ex. Excel, Matlab, servrar

  4. enkeltrådat, t.ex. Notepad, Word och Firefox

Det stora frågetecknet just nu är exakt hur bra/dåligt 1. är då det är den överlägset viktigaste klassen i praktiken för många som läser Sweclockers.com.

Det är de underliggande spelalgoritmerna som ställer till det så att vi inte har kunnat förutspå något alls.

Den lågnivå du nämner är dold av flera anledningar. Framförallt för att den är irrelevant när spelen saknar optimeringar som är transparenta mot användare; läs fps.

Cinebench i single och multi är väl korrelerade mot förmodade funktioner hos en dator. Däremot verkar spel leva i en annan värld som inte följer triviala regler som de du satt upp. IPC är godtyckligt mått som ändras beroende på algoritm. När algoritmen är ett nystan av dussintals rekursiva beroenden faller möjligheten mäta utfallet med godtagbar precision. Det är därför vi har svårt med äldre spel som GTA V med rötterna i kod som är runt ett decennium.

Skickades från m.sweclockers.com

För att vara rent tyckande finns det rätt mycket siffror att backa upp det med.

Jag håller absolut med om att Ryzen matchar IPC hos Broadwell, förutsatt att flaskhalsen är skalära flyttal. T.ex. Cinebench, Blender, 3D Marks Physics pekar alla på det. Så ser inte ens att vi är oense här.

Men det är också det ENDA fallet där Ryzen matchar Broadwell i IPC. i7-4770K når ungefär 80 % av sin teoretiska kapacitet för vektoriserade flyttal, Broadwell-E når ca 90 %. Skylake når 99 % av sin teoretiska kapacitet.

Finns ingen anledning att tro att Ryzen inte når väldigt nära 100 % av sin teoretiska kapacitet här, men det betyder ändå att Skylake har 100 % bättre IPC på denna punkt och Broadwell 80-90 % högre.

Gjorde en del beräkningar för att skatta heltals IPC från SweClockers spelmätningar här, kom fram till att Haswell/Broadwell har ungefär 19 % bättre IPC (Skylake får då 45 % högre IPC).

Jämför man SPECInt_2006 resultatet mellan Ryzen och i5-4670 får man en indikation på att IPC för den senare är 58 % högre. Notera att detta är enda testet som inte alls kan använda SMT då det är enkeltrådat, så förväntat att Zen klarar sig sämre relativt Core här.

Och för att ta mitt favoritfall, kompilering , så är detta faktiskt fallet där Ryzen klarar sig klart bäst. Enligt mina beräkningar är IPC ca 33 % för Skylake (ca 17 % bättre för Haswell). Just fallet här verkar värdet på p (andel parallell del i Amdahls) ligga på 97-98 %, vilket känns rimligt då kompilering skalar extremt. Är bara länkning och den synkronisering som OSet gör för disk-I/O som är seriellt.

Notera att R7-1700 och i7-7700K får på sekunden exakt samma resultat i kompileringstestet!

Ganska väntat att IPC varierar betydligt för skalära heltal. Flyttalsintensiv kod (vare sig den är skalär eller vektoriserad) tenderar att innehålla väldigt lite villkorad körning samt instruktionerna har relativt hög latens -> flaskhalsen bli kapaciteten hos ALUs.

Program som jobbar med skalära heltal tenderar ha väldigt hög andel villkorad körning, de flesta instruktioner tar 1 cykel att utföra och finns ofta väldigt mycket data-beroende mellan instruktioner. D.v.s. genomsnittlig IPC är i praktiken aldrig begränsat av ALUs, utan är andra saker som spelar in här (och olika saker för olika fall).

Skrev i början av denna tråd att IPC för skalära heltal kommer vara lägre för Zen. Det har varit uppenbart ända sedan det blev känt att Zen använder en distribuerad schemaläggare för heltalsdelen samt att teoretisk kapacitet på heltalsdelen är väldigt snarlik Haswell/Broadwell.

Global vs distribuerad schemaläggare är som mycket annat ett val där det inte den ena är konsekvent bättre än den andra. En global schemaläggare kommer utnyttja tillgängliga resurser bättre, men den kostar mer kisel och drar mer ström. SMT ger normalt sett en större boost om man har en distribuerad schemaläggare då en global schemaläggare kan bättre utnyttja resurser redan vid en tråd, SweClockers mätning visar också att Ryzen får hela 40 % boost från SMT vilket är mer än de 20-30 % som Core brukar se.

Att Zen rimligen kommer se större boost från SMT är också något jag skrev tidigt i denna tråd.

Keller ses ofta som någon form av frälsare som kan göra det omöjliga. Han är extremt duktig och innan AMD jobbade han hos Apple med deras CPU, där lär FoU-budget varit i stort sett obegränsad, så även extremt dyra idéer kunde testas. Twister/Cyclone har precis som Zen en distribuerad schemaläggare och i sina bästa stunder matchar dessa CPU-kärnor Haswell i heltals IPC. Men Twister/Cyclone är väsenligt mycket bredare än även Skylake, de har totalt 11 heltalspipelines(!) + 2 AGUs mot Zens 4 + 2 AGUs samt Haswells 4 + 4 AGU (är dock lite äpple mot päron att jämföra ARM mot x86 så här).

Ofta spelar inte ISA någon roll, men x86 har en del kvarnstenar i sin design (främst minneskonsistensmodellen) som gör det extremt komplicerat att göra riktigt breda designer. Apple har ju en annan underlättande faktor i att de siktar på betydligt lägre frekvenser med sin design. Poängen är ändå: både Apples design + POWER8 (som också använder distribuerad schemaläggare och är en extremt bred design) ger en vink om att distribuerad schemaläggare har inte samma effektivitet som en global schemaläggare. I fallet POWER8 ser man väldigt bra effekten av SMT, vid 4 kärnor är den designen klart bättre IPC per kärna än Intel men med 1-2 CPU-trådar per kärna har Intel högre IPC.

Varför skulle Zen magiskt vara annorlunda på denna punkt? Och finns det något som pekar på att IPC för skalära heltal ligger på Haswell/Broadwell-nivå?

Och hur kan man då säga att IPC för Ryzen är på Haswell/Broadwell-nivå när det bara är sant för skalära flyttal?

Går man vidare till cache-design finns även där avvägningar, ingen är entydigt bättre än den andra. Intels design är tveklöst bättre i fall där CPU-kärnor måste synkronisera sitt jobb, bl.a. därför att L3$ kan användas som ett snoop-filter.

Ryzens design ger större effektiv cachestorlek och uppdelningen i två L3$ över de två CCXerna betyder högre aggregerad L3$-bandbredd. Så Ryzen har en cache som är bättre lämpad för problem som är "embarrassing parallel". Spel hör inte hit och det är inget AMD någonsin kommer kunna fixa i programvara.

Skrivet av Oegat:

Hur säkra är vi på siffran 22Gb/s? Någon som testat hur stort problem det innebär i praktiken?

Jag tänkte förut när Ryzens system med 2 CCX blev känt att detta borde bli en issue, men så tänkte jag att det gick ju att lösa med Core2Quad (Q6600 etc) som också bestod av 2 st 2-kärniga kluster med varsin LLC. Så det borde inte vara svårare att lösa med Ryzen, tänkte jag. Men det finns ju massor av aber i ett sådant antagande, inser jag såklart.

Jag vet inte om Windows nuförtiden är NUMA-aware, i så fall kunde Ryzen presentera sig som en CPU med två NUMA-noder, en per CCX. Alternativt att man själv tillåts specificera NUMA-arkitekturen. Det borde ge önskad anpassning av schemaläggaren utan att någon ny funktionalitet måste utvecklas från grunden.

Har försökt hitta källan till 22 GB/s, men gått bet. Ser inte riktigt hur man skulle komma dit heller. Infinity fabric är i praktiken Hypertransport 2.0. AnandTech konstaterar (precis som jag gjorde en bra bit bak i denna tråd) att Infinity fabric konceptuellt inte skiljer sig från vad man hittar i t.ex. ARM SoCer.

Normalt har en sådan "fabric" en egen klockdomän, Hypertransport tror jag klockade upp till 3,2 GHz. QPI ligger ofta också på 3,2 GHz men tror det kan klockas upp till 4,0 GHz idag.

Om man antar en frekvens på någonstans mellan 3,2-4,0 GHz så blir en rimlig bredd 64-bitar. Bandbredden borde då hamna mellan 26 GB/s - 32 GB/s så får inte riktigt ihop 22 GB/s siffran, den verkar låg.

Sedan är bandbredd mindre viktigt, frågan för spel är: vad ligger latensen på?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Puget Systems har gjort relativt omfattande tester av 1700X i ett par av Adobes tyngre program. Dessa säger betydligt mer än Sweclockers och många andra siters helt meningslösa tester som t ex enbart testar export av ett visst format i Premiere Pro och inte ens med nuvarande versioner.

Resultaten är minst sagt varierande, tyvärr. Man kan ju ha åsikter om Adobes hantering av kärnor men det här så här verkligheten ser ut, just nu.

Photoshop:
https://www.pugetsystems.com/labs/articles/Adobe-Photoshop-CC...

Lightroom:
https://www.pugetsystems.com/labs/articles/Adobe-Lightroom-CC...

Premiere Pro:
https://www.pugetsystems.com/labs/articles/Premiere-Pro-CC-20...

Bonus, 1700X i SolidWorks 2017:
https://www.pugetsystems.com/labs/articles/SOLIDWORKS-2017-AM...

Visa signatur

Citera -> större chans till svar.

Permalänk
Medlem

Hittade denna review på random:

https://www.youtube.com/watch?v=zRAuZUJF68I

1700X matchar eller är snabbare än 7700K enligt den (framförallt i min fps i Tomb Raider där Ryzen dominerar!), med Singularity som den enda där den "bara" är några fps långsammare.

Alltså man blir ju fan förvirrad.

Permalänk
Medlem
Skrivet av murklor:

Hittade denna review på random:

https://www.youtube.com/watch?v=zRAuZUJF68I

1700X matchar eller är snabbare än 7700K enligt den (framförallt i min fps i Tomb Raider där Ryzen dominerar!), med Singularity som den enda där den "bara" är några fps långsammare.

Alltså man blir ju fan förvirrad.

Själv har jag lite svårt att lita på honom, att han visar upp medelfps på vissa titlar medan i andra titlar både medel & min fps ser helt skumt för mig.

Han borde i alla fall vara konsekvent med vilka diagram han visar upp, för mig känns det som han försöker vinkla det till något positivt för 1700X.

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Medlem
Skrivet av Gruarn:

Vad gäller ni driver till windows, Det finns tydligen skäl att tro att MS gjort bort sig lite.

Igen.

När missade de drivrutiner till en Intel-release senast? Jag vet när det hände AMD senast iaf...

Det där skulle kunna förklara en del underliga beteenden, samtidigt så låter det nästan lite för otroligt att ingen från AMD eller någon annan skulle märkt det innan lansering. Känns väl mer som att sysinternals misstolkar något i sin koll.

En annan bug verkar vara nVidias drivare som får tuppjuck och använder enorma mängder vram på ryzen plattformen, samma beteende hade inte AMD kort men det är illa nog att bara ett fåtal testare sett buggen alls. Hoppas alla parter kan fixa till respektive buggar inom en snar framtid.

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem

Någon med liknande problem eller bara världens oflyt?

Permalänk
Medlem
Skrivet av tellus82:

Det där skulle kunna förklara en del underliga beteenden, samtidigt så låter det nästan lite för otroligt att ingen från AMD eller någon annan skulle märkt det innan lansering. Känns väl mer som att sysinternals misstolkar något i sin koll.

Skickades från m.sweclockers.com

Givet att exakt detta hänt en gång förut är jag inte förvånad...

Permalänk
Medlem
Skrivet av LeVvE:

https://www.youtube.com/watch?v=3JPWlps362U

Någon med liknande problem eller bara världens oflyt?

Naturligtvis är det processorn fel! Den styr ju precis allt som har med minnet att göra!

Permalänk
Medlem
Skrivet av Gruarn:

Naturligtvis är det processorn fel! Den styr ju precis allt som har med minnet att göra!

Nej men skulle kunna vara moderkortet.

Permalänk
Hjälpsam
Skrivet av Ratatosk:

Köpte ett Bitfenix 750W Whisper från Inet.
http://www.sweclockers.com/test/23247-bitfenix-whisper-m-750-...
Har ett Cooler Master 700W (V 700 tror jag), inkopplad i min gamla dator, tänker testa med det i morgon.
https://www.komplett.se/product/791771?gclid=CLvLxYSWvdICFQfP...

Testat med ett annat nätaggregat, japp det är nog moderkortet.
Testat att bygla SW-on pinnarna och har även ringt knappen, dragit ut alla extra anslutningar, inget fungerar.
Känns märkligt att Nätagget inte ens startar.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem

Skulle kunna vara vad fan som helst från måndagsexemplar till SBS. Har själv lyckats sätta in saker där det varit rena nyårsafton som resultat, trots att alla former av ström varit borta från moderkortet. Även om det var länge sedan nu.

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Medlem

@Ratatosk: Kollat grafikkortet? Min brors grafikkort pajade nyligen. Nätagget vägrade starta när det var inkopplat.

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Administrativ avgift

Någon som har några fläskiga resultat från 1700 och B350 moderkort?

Visa signatur

Jonsbo i100| 7950x3D | B650-i | 2x16GB DDR5 CL30@6000 | 2TB m.2 | 4090 TUF | SF600 | Samsung G9 49 OLED | Quest Pro | Noctua fans | Custom loop

Permalänk
Hjälpsam
Skrivet av OldComputer:

@Ratatosk: Kollat grafikkortet? Min brors grafikkort pajade nyligen. Nätagget vägrade starta när det var inkopplat.

Tack för tipset.
Ja testat med och utan grafikkort, grafikkortet fungerar, har kopplat in det igen på min gamla dator.

Startat en ny tråd under nätaggregat i stället för att smutsa ned denna ännu mer.
http://www.sweclockers.com/forum/trad/1468046-nytt-moderkort-...

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem
Skrivet av OldComputer:

@Ratatosk: Kollat grafikkortet? Min brors grafikkort pajade nyligen. Nätagget vägrade starta när det var inkopplat.

Vet att det var nån ryss som streamade när han byggde sitt system för nån vecka sedan som hade problem att få det att starta. Vet inte om det var grafikkortet, men först efter han bytt allt i omgångar (minne, gfx, psu) fick han igång det. Kan dock inte ryska så vet inte vad de sa var orsaken. Men skulle testa med annat grafikkort om du har ett.

Permalänk
Medlem

Proshop verkar ha fått in Gigabyte Aorus GA-AX370-Gaming 5 nu för de intresserade. Dock passade de på att höja priset med 150kr också.

Edit: Bara +100 nu tydligen, var +150 tidigare.

Permalänk
Medlem

Intressant video om effekten att klocka CPU och/eller minne.
En 1800X till 4075 och minnet från 2133 till 3200 resp 3666.

Overclocking AMD Ryzen 7 1800X with ROG Crosshair VI Hero and G.SKILL Trident Z

(Videon visar en 1700 då de redan skickat tillbaka 1800X när de spelade in b-roll)

Permalänk
Medlem
Skrivet av LeVvE:

https://www.youtube.com/watch?v=3JPWlps362U

Någon med liknande problem eller bara världens oflyt?

Sätter inte moderkortets XMP-profil spänningen för högt 1.5V? Den ska väl ligga på 1.35V med XMP-profilen inställd på 3000Mhz

Visa signatur

“When a clown moves into a palace he doesn’t become a king, the palace instead becomes a circus.”

Permalänk
Medlem
Skrivet av Yoshman:

För att vara rent tyckande finns det rätt mycket siffror att backa upp det med.

Jag håller absolut med om att Ryzen matchar IPC hos Broadwell, förutsatt att flaskhalsen är skalära flyttal. T.ex. Cinebench, Blender, 3D Marks Physics pekar alla på det. Så ser inte ens att vi är oense här.

Men det är också det ENDA fallet där Ryzen matchar Broadwell i IPC. i7-4770K når ungefär 80 % av sin teoretiska kapacitet för vektoriserade flyttal, Broadwell-E når ca 90 %. Skylake når 99 % av sin teoretiska kapacitet.

Finns ingen anledning att tro att Ryzen inte når väldigt nära 100 % av sin teoretiska kapacitet här, men det betyder ändå att Skylake har 100 % bättre IPC på denna punkt och Broadwell 80-90 % högre.

Gjorde en del beräkningar för att skatta heltals IPC från SweClockers spelmätningar här, kom fram till att Haswell/Broadwell har ungefär 19 % bättre IPC (Skylake får då 45 % högre IPC).

Jämför man SPECInt_2006 resultatet mellan Ryzen och i5-4670 får man en indikation på att IPC för den senare är 58 % högre. Notera att detta är enda testet som inte alls kan använda SMT då det är enkeltrådat, så förväntat att Zen klarar sig sämre relativt Core här.

Och för att ta mitt favoritfall, kompilering , så är detta faktiskt fallet där Ryzen klarar sig klart bäst. Enligt mina beräkningar är IPC ca 33 % för Skylake (ca 17 % bättre för Haswell). Just fallet här verkar värdet på p (andel parallell del i Amdahls) ligga på 97-98 %, vilket känns rimligt då kompilering skalar extremt. Är bara länkning och den synkronisering som OSet gör för disk-I/O som är seriellt.

Notera att R7-1700 och i7-7700K får på sekunden exakt samma resultat i kompileringstestet!

Ganska väntat att IPC varierar betydligt för skalära heltal. Flyttalsintensiv kod (vare sig den är skalär eller vektoriserad) tenderar att innehålla väldigt lite villkorad körning samt instruktionerna har relativt hög latens -> flaskhalsen bli kapaciteten hos ALUs.

Program som jobbar med skalära heltal tenderar ha väldigt hög andel villkorad körning, de flesta instruktioner tar 1 cykel att utföra och finns ofta väldigt mycket data-beroende mellan instruktioner. D.v.s. genomsnittlig IPC är i praktiken aldrig begränsat av ALUs, utan är andra saker som spelar in här (och olika saker för olika fall).

Skrev i början av denna tråd att IPC för skalära heltal kommer vara lägre för Zen. Det har varit uppenbart ända sedan det blev känt att Zen använder en distribuerad schemaläggare för heltalsdelen samt att teoretisk kapacitet på heltalsdelen är väldigt snarlik Haswell/Broadwell.

Global vs distribuerad schemaläggare är som mycket annat ett val där det inte den ena är konsekvent bättre än den andra. En global schemaläggare kommer utnyttja tillgängliga resurser bättre, men den kostar mer kisel och drar mer ström. SMT ger normalt sett en större boost om man har en distribuerad schemaläggare då en global schemaläggare kan bättre utnyttja resurser redan vid en tråd, SweClockers mätning visar också att Ryzen får hela 40 % boost från SMT vilket är mer än de 20-30 % som Core brukar se.

Att Zen rimligen kommer se större boost från SMT är också något jag skrev tidigt i denna tråd.

Keller ses ofta som någon form av frälsare som kan göra det omöjliga. Han är extremt duktig och innan AMD jobbade han hos Apple med deras CPU, där lär FoU-budget varit i stort sett obegränsad, så även extremt dyra idéer kunde testas. Twister/Cyclone har precis som Zen en distribuerad schemaläggare och i sina bästa stunder matchar dessa CPU-kärnor Haswell i heltals IPC. Men Twister/Cyclone är väsenligt mycket bredare än även Skylake, de har totalt 11 heltalspipelines(!) + 2 AGUs mot Zens 4 + 2 AGUs samt Haswells 4 + 4 AGU (är dock lite äpple mot päron att jämföra ARM mot x86 så här).

Ofta spelar inte ISA någon roll, men x86 har en del kvarnstenar i sin design (främst minneskonsistensmodellen) som gör det extremt komplicerat att göra riktigt breda designer. Apple har ju en annan underlättande faktor i att de siktar på betydligt lägre frekvenser med sin design. Poängen är ändå: både Apples design + POWER8 (som också använder distribuerad schemaläggare och är en extremt bred design) ger en vink om att distribuerad schemaläggare har inte samma effektivitet som en global schemaläggare. I fallet POWER8 ser man väldigt bra effekten av SMT, vid 4 kärnor är den designen klart bättre IPC per kärna än Intel men med 1-2 CPU-trådar per kärna har Intel högre IPC.

Varför skulle Zen magiskt vara annorlunda på denna punkt? Och finns det något som pekar på att IPC för skalära heltal ligger på Haswell/Broadwell-nivå?

Och hur kan man då säga att IPC för Ryzen är på Haswell/Broadwell-nivå när det bara är sant för skalära flyttal?

Går man vidare till cache-design finns även där avvägningar, ingen är entydigt bättre än den andra. Intels design är tveklöst bättre i fall där CPU-kärnor måste synkronisera sitt jobb, bl.a. därför att L3$ kan användas som ett snoop-filter.

Ryzens design ger större effektiv cachestorlek och uppdelningen i två L3$ över de två CCXerna betyder högre aggregerad L3$-bandbredd. Så Ryzen har en cache som är bättre lämpad för problem som är "embarrassing parallel". Spel hör inte hit och det är inget AMD någonsin kommer kunna fixa i programvara.

Har försökt hitta källan till 22 GB/s, men gått bet. Ser inte riktigt hur man skulle komma dit heller. Infinity fabric är i praktiken Hypertransport 2.0. AnandTech konstaterar (precis som jag gjorde en bra bit bak i denna tråd) att Infinity fabric konceptuellt inte skiljer sig från vad man hittar i t.ex. ARM SoCer.

Normalt har en sådan "fabric" en egen klockdomän, Hypertransport tror jag klockade upp till 3,2 GHz. QPI ligger ofta också på 3,2 GHz men tror det kan klockas upp till 4,0 GHz idag.

Om man antar en frekvens på någonstans mellan 3,2-4,0 GHz så blir en rimlig bredd 64-bitar. Bandbredden borde då hamna mellan 26 GB/s - 32 GB/s så får inte riktigt ihop 22 GB/s siffran, den verkar låg.

Sedan är bandbredd mindre viktigt, frågan för spel är: vad ligger latensen på?

Visst finns det siffror att backa upp det med. Det är ju det som är problemet idag, det finns så många siffror att man kan visa vad som helst för att få rätt. Du ställde en fråga i början på december förra året:

Skrivet av Yoshman:

Finns ju en benchmark med namnet Queen som är del i AIDA64, skulle vara intressant att se resultat för Zen i denna. Inte just för att det skalar väl utan för att denna benchmark har visat sig vara en bra indikator på kvalitén hos branch-predictor i CPUn. Designer med en dålig sådan presterar illa i detta test (men skalar fortfarande linjärt med antal kärnor).

Nu har den kommit.

Titeln på sidan är "Benchmarks bei 3 GHz: AIDA64", dvs de är alla ställda på 3.0 GHz.

Du ställde frågan: "Och hur kan man då säga att IPC för Ryzen är på Haswell/Broadwell-nivå när det bara är sant för skalära flyttal?"

AIDA64 och Queen är väl knappast skalära flyttal.

Haswell-E och Ryzen får praktiskt taget samma värde vid 3.0 GHz, vid 8C/16T vilket alltså tyder på likvärdig IPC.

Skylake ligger på drygt hälften i "punkter" med 4C/8T, vilket också ger ett värde i samma härad, vilket också visar på likvärdig IPC.

Vad jag kan förstå borde då resultaten på sådan indikator, branch-prediction, stämma bättre överens med spelresultaten. Men, det gör det inte, och som vi har sett är dessa någorlunda "lågnivå-indikatorer" ganska oberäkneliga för spel. Ibland, i ett fåtal tester så vinner Ryzen över allt vad intel har, men dessa resultat verkar varken stämma med mina tidigare gissningar om uppdelningar på kärn- eller GHz-begränsade spel.

Vad jag försökte säga är att spelen verkar följa helt obeskrivna, tidigare okända lagar, som gissningvis då mer beror på spelens egna algoritmer, där cache-storlekar, matrishanteringar, mm döljs av annan, ren spel-logik vilket jag uppfattar att du också är inne på.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem