Permalänk
Medlem
Skrivet av Enigma:

Bits&Chips rapporterar följande på tidiga ES av Zen:

- "We can say that best performance/power consumption ratio is about 4.2 GHz, but RyZen can be clocked higher."

Detta är alltså dom överklockningar som gjorts på ES exemplar, och som nyss rapporterat:

- "AMD is tweaking the final frequencies. Latest revisions of Zen are allowing higher frequencies than expected."

Detta stöds också av fler källor. Tror också att Zen når högre frekvenser än väntat i sin färdiga revision då Lisa Su sa på scen att "we still improving", och man verkar köra låg FO4 i tillverkningsprocessen och lärt sig mycket av högfrekvensdesignen som Bulldozer var. Det ser ut som att rev A3 (ev rev A4) är färdigt kisel som är i massproduktion där det sagts att A2 hade problem med turbo och SenseMI.

Intressant nog så har AMD också patenterat en ny typ av termisk oscillator som tar 150 gånger mindre plats än befintliga termiska dioder som man använder för övervakning. Lisa Su sa på Ryzen-eventet att Zen har hundratals av sensorer, så detta är vad jag tänker på i första hand:

http://www.freshpatents.com/-dt20161124ptan20160341604.php

http://images1.freshpatents.com/img/2016034160420160341604-00000001.gif

Jag kommer inte vara feg när jag har Zen i mina händer och det ska klockas frenetiskt i min custom loop med dubbla 420mm rads/NF-A14 fläktar och VPP-755 pump som väntar drägglandes här. Beställde hem liquid metal pasta OM dom det går att göra delid på dom för säkerhets skull

Bilden borttagen även från källan. Någon som vet varför?

Visa signatur

Coca Cola missbrukare Förbjuden dryck för mig pga diabetes
AMD älskare
Katt älskare

Permalänk
Medlem
Skrivet av Enigma:

Givetvis jobbar konkurrenter aktivt med att sålla så djupt det går i konkurrentens planer så det håller jag med om helt och hållet. Låt oss dock ta upp Iris som du själv snackar om. AMD har SOC marknaden med grafik i sin egna ask här med PS4/xbox och den integrerade grafikdelen är väl utan att ta i rätt överlägsen sedan iGPU'er tog fart. Dock är det mycket positivt att se funktioner som Intel's quicksync och dess avkodningskapacitet som finns i Iris för en HTPC eller vanlig kontors PC. Alla tekniska nyheter som dessa är bra. Det väger dock inte upp mot ren grafisk prestanda, och det går mer än tunga rykten om att Intel ska licensiera patent rörande AMD's GPU-teknologier för att användas i sina processorer, därav denna dök upp efter diverse rapporter från nyhetssidor:

Det är egentligen inte så konsigt, och Intel har i åratal tidigare betalat enorma licenskostnader till nvidia för något som dom inte ens använt i sina iGPU'er i något större utsträckning. Grafikmarknaden är svår att ta sig in i och både AMD (speciellt efter uppköpet av ATI) och nvidia sitter på groteska mängder patent som faktiskt gör det svårt för Intel att blir riktigt konkurrenskraftig.

Så sent som Hot Chips presentationen så frågade också en en representant från Intel mycket ivrigt om Zen's LLC och interconnect. Det är mycket dom inte vet

Jo, samma rykten gör gällande att avtalet mellan Intel och nVidia går ut och då har Intel att välja mellan att vara utan iGPU eller licensiera annan teknik. Har man det valet är det inte svårt att se att de tjänar mer pengar på att välja AMD än att inte ha något. Att välja AMD är heller inte så konstigt som det kan tyckas, de är redan ömsesidigt beroende eftersom de licensierar grundläggande teknik från varandra.

Det, tillsammans med hur lika Zen och Core blir, ländar ju till frågan: Har AMD sålt en grafikteknik för någon teknik de lyckats implementera i både Vega och Zen? Kan det vara hemligheten?

Tycker du verkligen att AMD har iGPU-marknaden som i en liten ask? Vilket är det mest använda grafikkortet på stram? Intel iGPU. Vilket grafikkort används mest i bärbara datorer? Intel iGPU. Vilket är världens mest sålda grafikkort? ...

Jag håller nog inte med dig om att AMD är mest framgångsrika på den marknaden, utan Intel har lyckats utmanövrerad dem från sin egen marknad. Och vad gäller AMD:s överlägsenhet i prestanda vill jag minnas ett test på anandtech som visade att eDRAM mer än väl kompenserade AMD:s beräkningskapacitet och faktiskt slog AMD med DDR3. Det var i det testet det blev väldigt uppenbart att APU begränsas mest av minnesbandbredd. Jag sitter dock illa till, så jag hinner inte leta.

Slutlige vill jag påpeka att jag i grund och botten gör samma analys som swemerlin gällande i3K's vara eller icke vara, så skall jag förvänta mig samma bemötande?

Permalänk

Bärbara datorer

Hur tror ni det kommer bli med Zen och bärbara datorer? Det finns ingenting vettigt just nu vilket är riktigt tråkigt. Allt med AMD är bärbara på 15.6 tum eller större.

Det vill till att OEM tillverkarna vill göra intressanta bärbara datorer med AMD teknik. Kommer det bli någon skillnad på det framöver tror ni?

Visa signatur

Stationär Speldator: AMD Ryzen 7 2700 I AMD Radeon 6750 XT
Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti

Permalänk
Medlem
Skrivet av Swedish Berserk:

Hur tror ni det kommer bli med Zen och bärbara datorer? Det finns ingenting vettigt just nu vilket är riktigt tråkigt. Allt med AMD är bärbara på 15.6 tum eller större.

Det vill till att OEM tillverkarna vill göra intressanta bärbara datorer med AMD teknik. Kommer det bli någon skillnad på det framöver tror ni?

Tror att raven ridge kan bli häftigt att stoppa i en laptop!

Visa signatur

R5 3600 | 5700 xt | XPG SPECTRIX 3200MHz 16GB | B450i Aorus Pro WIFI | Corsair SF750v2 | Evolv Shift Air |
Galleri: Aether | Chandra

-=CITERA FÖR SVAR=-

Permalänk
Medlem

Jag misstänker att Ryzen SR7 BE kommer att klå Intel i7-7700K i många fall när man ökar upplösningen till över 1920x1080 i spel, dvs när GPUn flaskar.

Orsaken är att i7-6950X får pisk i samtliga spel av i7-7700K i lägre upplösningar, men inte alltid när upplösningen höjs.

Det visas av testerna i både
http://www.guru3d.com/articles_pages/core_i7_7700k_processor_...
http://www.sweclockers.com/test/23087-intel-core-i7-7700k-och...

Sedan hoppas jag att priset på i7-6950X inte förblir ett riktmärke.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Entusiast
Skrivet av sAAb:

Jag misstänker att Ryzen SR7 BE kommer att klå Intel i7-7700K i många fall när man ökar upplösningen till över 1920x1080 i spel, dvs när GPUn flaskar.

Orsaken är att i7-6950X får pisk i samtliga spel av i7-7700K i lägre upplösningar, men inte alltid när upplösningen höjs.

Det visas av testerna i både
http://www.guru3d.com/articles_pages/core_i7_7700k_processor_...
http://www.sweclockers.com/test/23087-intel-core-i7-7700k-och...

Sedan hoppas jag att priset på i7-6950X inte förblir ett riktmärke.

Nu förstår jag inte riktigt vad du menar?
7600K/7700K vinner ju över i7-6950X i nästan samtliga benchmarks du länkade till på Gurud3D i 1440p.

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Permalänk
Medlem
Skrivet av Serzarian:

Nu förstår jag inte riktigt vad du menar?
7600K/7700K vinner ju över i7-6950X i nästan samtliga benchmarks du länkade till på Gurud3D i 1440p.

I nästan samtliga.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Entusiast
Skrivet av sAAb:

I nästan samtliga.

Jag ändrar mig, det var faktiskt samtliga.
Skumläste lite bara.

Skickades från m.sweclockers.com

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Permalänk
Medlem
Skrivet av Serzarian:

Jag ändrar mig, det var faktiskt samtliga.
Skumläste lite bara.

Skickades från m.sweclockers.com

Ja, jag undrar hur jag läste själv...

Här vinner i7-6950X över i7-7700K vid låga inställningar på grafiken. http://www.guru3d.com/articles_pages/core_i7_7700k_processor_...
Här vinner i7-6950X över i7-7700K vid höga inställningar på grafiken. http://www.sweclockers.com/test/23087-intel-core-i7-7700k-och...

Hmmm. Vad är det då?

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Ratatosk:

En stor skillnad i dag gentemot när Bulldozer kom, är att spel faktiskt börjat använda många kärnor.

Beroende på hur Intel ligger till med Coffee/Canon Lake utvecklingen så kan Kaby varigt sista generationen i5 utan HT!

Vilket kan både vara bra och dåligt hur man nu ser på det, då även Intel börjar röra på sig i så fall.
Snackades det inte om ngn i3 med HT på gång?

Känns som ett rimligt alternativ att slå tillbaka utan att göra för mycket avkall på priset

Permalänk
Medlem
Skrivet av UncleDirty:

Snackades det inte om ngn i3 med HT på gång?

Alla i3:or har HT, men en överklockningsbar i3:a är på väg.

Visa signatur

De köper en bil. Säljaren säljer bilen till dem. Var är du? Vart ska du? Varifrån kom du?

Permalänk
Entusiast
Skrivet av sAAb:

Ja, jag undrar hur jag läste själv...

Här vinner i7-6950X över i7-7700K vid låga inställningar på grafiken. http://www.guru3d.com/articles_pages/core_i7_7700k_processor_...
Här vinner i7-6950X över i7-7700K vid höga inställningar på grafiken. http://www.sweclockers.com/test/23087-intel-core-i7-7700k-och...

Hmmm. Vad är det då?

Resultaten är ju inom felmarginalen både på Sweclockers och Guru3D.
Med andra ord är 4 kärnor fortfarande kung i spel, 8 trådar kan användas ibland och 8 kärnor är så gott om helt onödiga.

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Permalänk
Medlem

Efter CES kommer vi få benchmarks på Zen:
https://youtu.be/VLxPjoY6QgE?t=18m39s

Det här är ingenting som varit uppe tidigare tror jag.

Visa signatur

sweclockers prestandaindex

Efter 10 kommer 11.
Efter 99 kommer 100.

Permalänk
Skrivet av lowngcawt:

Tror att raven ridge kan bli häftigt att stoppa i en laptop!

Det kan den säkert bli! Frågan är om OEM tillverkarna är intresserade av att bygga lite mer premium datorer med AMD.

Visa signatur

Stationär Speldator: AMD Ryzen 7 2700 I AMD Radeon 6750 XT
Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti

Permalänk
Entusiast
Skrivet av ClintBeastwood:

Efter CES kommer vi få benchmarks på Zen:
https://youtu.be/VLxPjoY6QgE?t=18m39s

Det här är ingenting som varit uppe tidigare tror jag.

Hmmm, det var ett intressant uttalande... undrar om han bröt något NDA där eller om han bara menade att han skulle titta närmare på Kaby Lake "in the immediate future after CES" och att sen kolla på Zen när det kommer

Edit: Reddit har redan en tråd om det https://www.reddit.com/r/Amd/comments/5ltt0s/gamersnexus_zen_...

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Permalänk
Medlem
Skrivet av Enigma:

Bits&Chips rapporterar följande på tidiga ES av Zen:

- "We can say that best performance/power consumption ratio is about 4.2 GHz, but RyZen can be clocked higher."

Detta är alltså dom överklockningar som gjorts på ES exemplar, och som nyss rapporterat:

- "AMD is tweaking the final frequencies. Latest revisions of Zen are allowing higher frequencies than expected."

Detta stöds också av fler källor. Tror också att Zen når högre frekvenser än väntat i sin färdiga revision då Lisa Su sa på scen att "we still improving", och man verkar köra låg FO4 i tillverkningsprocessen och lärt sig mycket av högfrekvensdesignen som Bulldozer var. Det ser ut som att rev A3 (ev rev A4) är färdigt kisel som är i massproduktion där det sagts att A2 hade problem med turbo och SenseMI.

Intressant nog så har AMD också patenterat en ny typ av termisk oscillator som tar 150 gånger mindre plats än befintliga termiska dioder som man använder för övervakning. Lisa Su sa på Ryzen-eventet att Zen har hundratals av sensorer, så detta är vad jag tänker på i första hand:

http://www.freshpatents.com/-dt20161124ptan20160341604.php

http://images1.freshpatents.com/img/2016034160420160341604-00000001.gif

Jag kommer inte vara feg när jag har Zen i mina händer och det ska klockas frenetiskt i min custom loop med dubbla 420mm rads/NF-A14 fläktar och VPP-755 pump som väntar drägglandes här. Beställde hem liquid metal pasta OM dom det går att göra delid på dom för säkerhets skull

För att byta ämne en kort stund, vad är det för chassi du tänkte använda? Jag är i liknande tankar kring ett Zen bygge men har inte börjat köpa hem ngt iom att jag inte vet riktigt vilket chassi samt färgtema det blir.

Visa signatur

MSI MPG X870E Carbon WiFi| AMD Ryzen 9 9800X3D@5,4 GHz locked| MSI MAG Coreliquid A15 360| WD Black SN850X 1TB + WD Black SN850X 2TB| Corsair Vengeance, DDR5-6600 64GB (2 x 32GB) @6400MHz CL 30-37-37-50| MSI RTX 4090 Suprim X| Asus ROG PG32UCDM QD-OLED| MSI MPG A1000G PCIE5 1000W| Lian Li O-11 EVO|

Permalänk
Medlem
Skrivet av Swedish Berserk:

Det kan den säkert bli! Frågan är om OEM tillverkarna är intresserade av att bygga lite mer premium datorer med AMD.

Ja, det är ju den största frågan.
Har Intel satt sitt stryptag om OEM tillverkarna hårt nog för att AMD inte ska ha en chans att komma in på marknaden igen?

Skickades från m.sweclockers.com

Visa signatur

R5 3600 | 5700 xt | XPG SPECTRIX 3200MHz 16GB | B450i Aorus Pro WIFI | Corsair SF750v2 | Evolv Shift Air |
Galleri: Aether | Chandra

-=CITERA FÖR SVAR=-

Permalänk
Medlem
Skrivet av lowngcawt:

Ja, det är ju den största frågan.
Har Intel satt sitt stryptag om OEM tillverkarna hårt nog för att AMD inte ska ha en chans att komma in på marknaden igen?

Skickades från m.sweclockers.com

man får väl hoppas att det inte är längre så. delvis för att Intel har ju blivit dömt i EU rätten för det.

Visa signatur

GamingRig: Cooler Master NR200P/ASUS ROG STRIX B550-I GAMING/AMD Ryzen 5 5700G/Noctual NH-D12L/ASUS PRIME Radeon RX 9070 OC 16GB/Corsair SF750 Platinum/Kingston Fury Beast 2x16GB 3600MHz CL18/

Permalänk
Medlem
Skrivet av ArcticFire:

Alla i3:or har HT, men en överklockningsbar i3:a är på väg.

Så var det ju, skyller den på sömnbrist o_O

Permalänk
Datavetare
Skrivet av tellus82:

Så sedan 2011 har IPC stigit med ~25% för intel, hur man än vänder på det så är det hyggligt uselt och jäkligt bra för Ryzen. Såg förresten just att jag köpte min 2600k i början av 2011 för 2500kr och idag ligger en 7700k på 4290, på denna tiden har dollarn gått upp 40% men priset på cpu har alltså ökat 70%, jösses...

Det alla verkar missa är att AMD ökar 40 % från en nivå som ligger ~Athlon64/PentiumM, det är antika modeller.

Ingen förutom Apple har idag en CPU på marknaden med högre enkeltråd IPC än Sandy Bridge. Om det är så lätt att bygga en sådan, varför har så få gjort det då?

Och om det är så lätt, varför kommer inte Zen att ens ha en enkeltråd IPC högre än Haswell (tror det är väldigt nära 100 % säkert att så inte blir fallet)?

IBMs POWER8 har mer av allt jämfört med Haswell/Broadwell, ändå har Haswell/Broadwell Xeons högre enkeltrådprestanda. Men IBM får betydligt högre boost från SMT, så vid 3-4 trådar (CPU kan ha upp till 8 trådar) utför den mer per kärna än Intel.

Rätt säker att samma gäller för Zen. Det kommer vara mindre skillnad mellan Zen och Core när båda trådarna används i en CPU-kärna jämfört när bara en används. Orsaken är enkel, finns mindre outnyttjad kraft kvar i Intels fall och sett till antal ALUs och en rad andra saker är Zen och Haswell väldigt snarlika.

Skrivet av tellus82:

Jadu om man helt ignorerar klockning på en 2500k (man kan ta sig en funderare på varför man skulle göra det ...) så står sig i3an bra tack vare mycket högre frekvens och väldigt mycket högre minnesfrekvens. Den står sig verkligen inte mot en modern i5 i stock och börjar vi sedan prata minimum fps så är i3an äten. Presterar för den delen en i3 dåligt? nej det gör dom inte men att många idogt försöker påstå att i3 skulle kunna vara den perfekta gaming cpun är helt enkelt bisarrt.

Det jag ville visa var att klock-for-klock (i3 6100 och i5 2500K har samma maxfrekvens) är den förra faktiskt snabbare, även i spel.

Om nu Zen får en IPC i nivå med Ivy Bridge kommer därför en något högre klockad Kaby Lake i3 faktiskt vara helt jämförbar med SR3 i spel. I de flesta andra desktop-laster kommer i3 vara bättre p.g.a. högre enkeltrådprestanda.

D.v.s. i3 och SR3 är direkta konkurrenter. Men hävdar absolut inte att de är det optimala valet för spel, till och med spelutvecklarna säger att idag är "sweet-spot" 4 högt klockade kärnor + SMT. Det matchar bra de 6 trådar spelmotorer typiskt är optimerade för. 6 trådar då det är antalet man kan använda i dagens konsoler.

Skrivet av Enigma:

Jag funderade mer på om man kanske döljer en möjlig implementation av TSX, men kanske bara har den aktiverad i Naples, men sannolikheten är väl inte så stor. Dock inte mycket information som framkommit specifikt för Naples familjen ännu.

Zen ser ut att vara relativt kompakt för en octacore med 16MB L3. AMD har laborerat ganska friskt med high-density designer både på CPU men mest på GPU sidan, och så länge man inte har något spektakulärt så kan man väl utgå från att L3 cachen tar upp ungefär samma storlek som 4 Zen kärnor. Det är vad man kan se från dom dieshots som finns:

https://www.3dnews.ru/assets/external/illustrations/2016/07/25/936669/zen-die.png
https://3.bp.blogspot.com/-C8Dgu3SsaA4/V7Mn7lOYPZI/AAAAAAAABjE/bag3kdJ6bVYc0aSPNNz9sK3YzRKlZKmmACLcB/s1600/Zeppelin_Die_stitched_labelled.png

Jag har faktiskt svårt att tänka mig att L3 cachen kommer bli en akilleshäl i Zen för desktop/WS. L4 eller eDRAM fungerar ju på ett mycket likt sätt i Broadwell och har dessutom högre latency och off-core, men ger enorma fördelar i t.ex spel som man sett. AMD har tidigare hintat om "mostly" exclusive, men inte helt, så det är här man verkar sträcka sig med tags/hooks. Zen får ju också såpass stor L2 cache där man får ~1.5 större chans för en cache hit jämfört med Intel's L2 på 256Kb, så där är man eventuellt också mindre beroende av en multi-duplex design på LLC vid prefetch/demands.

Mycket har väl också att göra med att designen måste vara såpass modulär och där man kanske kan dela på ett CCX-kluster till quadcore SKU'er, men får dom dålig yield på octa's så ser man kanske quad's och hex med ett inaktiverat CCX-kluster. Åtminståne är det sannolikt att så blir fallet med hex-core av Zen men där AMD kanske har enskilda CCX-kluster till just quad's och eventuella dualcores. Jag tänker faktiskt mer över hur Naples kommer stå sig med en 512MB L3 cache och i HPC miljö där det kan vara mer kritiskt, men förhoppningsvis så slösar inte AMD bort såpass absurda mängder transistorer på en så stor cache för skoj skull Hoppas man avtäcker "resten" av Zen på CES!

Jo han var bra envis/nyfiken iaf Zen och Core har på en stor nivå många likheter som du beskriver, men cachearkitekturen skiljer sig en hel del och jag tror att respektives cachearkitektur är bäst lämpad för respektive processorer. Intel kör mindre cache med högre associativitet, medans AMD kör större cache och lägre associativitet. I en balanserad design där cache inte ger stall så är en hög hit nästan allt och jag tror man räknat på detta när man ser att L1-D är 8-vägs associativitet, precis som i Skylake. Skulle associativiteten på instruktionscachen vara ett problem här så skulle förmodligen IPC sjunka såpass drastiskt vid detta laget att man inte kunnat uppvisa det man gjort hittills. Man får också väga in designens energieffektivitet där associativitet oftast ger högre energikonsumtion, något som Zen verkar hålla nere på en fin nivå.

Att AMD skulle implementerat transaktionsminne på ett sätt != TSX skulle jag säga har absolut noll sannolikhet. TSX består av endast 6 instruktioner + det kräver OS stöd, något som Intel redan fixat (och AMD har historiskt varit usel på att fixa programstöd för sina HW-finesser).

Tror också att cache-designen i Zen är riktigt bra. Pekar bara på för just för lås, som är en väldigt viktig sak i många desktop-applikationer, så kommer Zen ha högre latens än Core.

I båda fallen lurar man ut via L3 vilken annan kärna som senaste använde låset (då i tillstånd "modified"). Så till den punkten är det lika snabbt.

Core har i det läget även värdet för cache-line, så kvar är att ändra tillståndet till "shared" och kopiera data.

Zen måste gå till L2 hos den kärna som senast använde låset och kopiera data till lokal L1/L2.

Om nu låset är olåst så kommer kärna nummer två skriva, då måste man invalidera cache-line för den andra kärnan.

För Core går man till L3, skickar en invalidate till andra kärnan (som då bara raderar sin L1/L2 kopia) och ändrar tillståndet till "modified". Sedan skriver man nya värdet till L1 (och sinom tid till L3)

För Zen går man till L3, skickar en invalidate till andra kärnan (som då också bara raderar sin L1/L2 kopia) och ändrar tillståndet till "modified". Så lika dit. Men för att skriva värdet till L1 måste man först hitta en cache-line i L3 dit man kan kopiera nuvarande data (som blir ett "victim") som ligger i L1/L2. Först när den kopieringen är klar kan man skriva ner värdet i L1/L2.

Vad det gäller cache-designen i allmänhet håller jag med om att man har lite olika prioritet.

Core är helt optimerad för maximal enkeltrådprestanda, man försöker sedan hantera SMT fallet med väldigt hög bandbredd då SMT kan dölja latens.

Zen är helt optimerad för SMT-fallet. Att ha större L1I-cache och L2 är i detta läge en fördel då SMT gör att den effektiva cache-storleken kapas på mitten.

L1D är 32 kB och 8 ways av latensskäl. Varje "set" blir då 4 kB så man kan avgöra om det är en träff/miss innan man får tillbaka resultatet från TLB (då page-size är 4 kB).

L1I är 64 kB på Zen, men 4 ways. Det ger högre latens än Cores 32 kB och 8 ways då Zen inte kan avgöra om det är en träff/miss innan TLB resultatet kommer tillbaka. 64 kB skulle kräva 16 ways för att vara latensoptimerad, det drar för mycket ström. Men SMT kan dölja latens och en större L1I blir därför en fördel där.

Zen har 512 kB 16 ways i L3. Upp till Broadwell hade Intel 256 kB 8 ways men i Skylake minskade man till 4 ways (drar mindre ström) och dubblade istället bandbredd mot L3 (vilket drar mer ström, med antagligen en nettovinst i strömförbrukning då Skylake drar något mindre).

Zen och POWER8 har väldigt snarlik L1-L3 konfiguration. POWER8 är absolut optimerad för SMT-fallet, den får en hel del stryk av Core i enkeltrådfallet.

Missade också en sak som sades i presentationen, Zen får också "store-forwarding". Något som introducerades i Nehalem och förbättrats i Sandy Bridge och Haswell (fler fall där det går att använda).

Storleken på 8-kärnor är väl ändå rätt lika mellan Zen och Broadwell? Ser också ut som de har väldigt snarlik fördelning av kiselyta mellan kärnor, L3 och "uncore". E-serien har något mer L3 per kärna och en större uncore, men är väl run ~200 mm^2 för 8 Zen-kärnor? Är ~250 mm^2 för 10 Broadwell-E kärnor, d.v.s. två fler kärnor och 9 MB mer L3 (tror de andra E-seriemodellerna bara är kapade varianter av 6950X, så alla har samma storlek).

Så skulle inte kalla Zen-kärnorna för "små". De är stora jämfört med 8 Cortex A57/A72 kärnor, de är gigantiska mot 8 Cortex A53 ;). De verkar vara ungefär som Intels Core-kärnor i storlek.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Det alla verkar missa är att AMD ökar 40 % från en nivå som ligger ~Athlon64/PentiumM, det är antika modeller.

Ingen förutom Apple har idag en CPU på marknaden med högre enkeltråd IPC än Sandy Bridge. Om det är så lätt att bygga en sådan, varför har så få gjort det då?

Och om det är så lätt, varför kommer inte Zen att ens ha en enkeltråd IPC högre än Haswell (tror det är väldigt nära 100 % säkert att så inte blir fallet)?

IBMs POWER8 har mer av allt jämfört med Haswell/Broadwell, ändå har Haswell/Broadwell Xeons högre enkeltrådprestanda. Men IBM får betydligt högre boost från SMT, så vid 3-4 trådar (CPU kan ha upp till 8 trådar) utför den mer per kärna än Intel.

Rätt säker att samma gäller för Zen. Det kommer vara mindre skillnad mellan Zen och Core när båda trådarna används i en CPU-kärna jämfört när bara en används. Orsaken är enkel, finns mindre outnyttjad kraft kvar i Intels fall och sett till antal ALUs och en rad andra saker är Zen och Haswell väldigt snarlika.

Det jag ville visa var att klock-for-klock (i3 6100 och i5 2500K har samma maxfrekvens) är den förra faktiskt snabbare, även i spel.

Om nu Zen får en IPC i nivå med Ivy Bridge kommer därför en något högre klockad Kaby Lake i3 faktiskt vara helt jämförbar med SR3 i spel. I de flesta andra desktop-laster kommer i3 vara bättre p.g.a. högre enkeltrådprestanda.

D.v.s. i3 och SR3 är direkta konkurrenter. Men hävdar absolut inte att de är det optimala valet för spel, till och med spelutvecklarna säger att idag är "sweet-spot" 4 högt klockade kärnor + SMT. Det matchar bra de 6 trådar spelmotorer typiskt är optimerade för. 6 trådar då det är antalet man kan använda i dagens konsoler.

Att AMD skulle implementerat transaktionsminne på ett sätt != TSX skulle jag säga har absolut noll sannolikhet. TSX består av endast 6 instruktioner + det kräver OS stöd, något som Intel redan fixat (och AMD har historiskt varit usel på att fixa programstöd för sina HW-finesser).

Tror också att cache-designen i Zen är riktigt bra. Pekar bara på för just för lås, som är en väldigt viktig sak i många desktop-applikationer, så kommer Zen ha högre latens än Core.

I båda fallen lurar man ut via L3 vilken annan kärna som senaste använde låset (då i tillstånd "modified"). Så till den punkten är det lika snabbt.

Core har i det läget även värdet för cache-line, så kvar är att ändra tillståndet till "shared" och kopiera data.

Zen måste gå till L2 hos den kärna som senast använde låset och kopiera data till lokal L1/L2.

Om nu låset är olåst så kommer kärna nummer två skriva, då måste man invalidera cache-line för den andra kärnan.

För Core går man till L3, skickar en invalidate till andra kärnan (som då bara raderar sin L1/L2 kopia) och ändrar tillståndet till "modified". Sedan skriver man nya värdet till L1 (och sinom tid till L3)

För Zen går man till L3, skickar en invalidate till andra kärnan (som då också bara raderar sin L1/L2 kopia) och ändrar tillståndet till "modified". Så lika dit. Men för att skriva värdet till L1 måste man först hitta en cache-line i L3 dit man kan kopiera nuvarande data (som blir ett "victim") som ligger i L1/L2. Först när den kopieringen är klar kan man skriva ner värdet i L1/L2.

Vad det gäller cache-designen i allmänhet håller jag med om att man har lite olika prioritet.

Core är helt optimerad för maximal enkeltrådprestanda, man försöker sedan hantera SMT fallet med väldigt hög bandbredd då SMT kan dölja latens.

Zen är helt optimerad för SMT-fallet. Att ha större L1I-cache och L2 är i detta läge en fördel då SMT gör att den effektiva cache-storleken kapas på mitten.

L1D är 32 kB och 8 ways av latensskäl. Varje "set" blir då 4 kB så man kan avgöra om det är en träff/miss innan man får tillbaka resultatet från TLB (då page-size är 4 kB).

L1I är 64 kB på Zen, men 4 ways. Det ger högre latens än Cores 32 kB och 8 ways då Zen inte kan avgöra om det är en träff/miss innan TLB resultatet kommer tillbaka. 64 kB skulle kräva 16 ways för att vara latensoptimerad, det drar för mycket ström. Men SMT kan dölja latens och en större L1I blir därför en fördel där.

Zen har 512 kB 16 ways i L3. Upp till Broadwell hade Intel 256 kB 8 ways men i Skylake minskade man till 4 ways (drar mindre ström) och dubblade istället bandbredd mot L3 (vilket drar mer ström, med antagligen en nettovinst i strömförbrukning då Skylake drar något mindre).

Zen och POWER8 har väldigt snarlik L1-L3 konfiguration. POWER8 är absolut optimerad för SMT-fallet, den får en hel del stryk av Core i enkeltrådfallet.

Missade också en sak som sades i presentationen, Zen får också "store-forwarding". Något som introducerades i Nehalem och förbättrats i Sandy Bridge och Haswell (fler fall där det går att använda).

Storleken på 8-kärnor är väl ändå rätt lika mellan Zen och Broadwell? Ser också ut som de har väldigt snarlik fördelning av kiselyta mellan kärnor, L3 och "uncore". E-serien har något mer L3 per kärna och en större uncore, men är väl run ~200 mm^2 för 8 Zen-kärnor? Är ~250 mm^2 för 10 Broadwell-E kärnor, d.v.s. två fler kärnor och 9 MB mer L3 (tror de andra E-seriemodellerna bara är kapade varianter av 6950X, så alla har samma storlek).

Så skulle inte kalla Zen-kärnorna för "små". De är stora jämfört med 8 Cortex A57/A72 kärnor, de är gigantiska mot 8 Cortex A53 ;). De verkar vara ungefär som Intels Core-kärnor i storlek.

"Och om det är så lätt, varför kommer inte Zen att ens ha en enkeltråd IPC högre än Haswell (tror det är väldigt nära 100 % säkert att så inte blir fallet)?"

Vad är det som gör att du tycker att det är näst intill 100% säkert?

Visa signatur

AMD RYZEN 9 5900X - ASUS ROG X470-F STRIX - 32GB DDR4 @ 3200MHz - ASUS RTX 3070 Ti

Permalänk
Datavetare
Skrivet av Stoff3th3m4n:

"Och om det är så lätt, varför kommer inte Zen att ens ha en enkeltråd IPC högre än Haswell (tror det är väldigt nära 100 % säkert att så inte blir fallet)?"

Vad är det som gör att du tycker att det är näst intill 100% säkert?

SweClockers har tyvärr mest CPU-tester som främst testar flyttal och som skalar perfekt med kärnor, så lite svårt att se exakt hur enkeltrådprestanda står sig där.

Techreport har inte heller jättemycket tester som kör enkeltrådprestanda, men finns i alla fall fyra stycken så man vaskar bort de mest avvikande värdena.

Räknar man ut enkeltrådprestanda och sedan kompenserar för skillnad i frekvens för att få ett mått på hur IPC står sig mellan olika modeller ser man att alla fyra tester (de tre JS-testerna, som är en blandning av heltal och flyttal med p.g.a. JS-motor är främst heltalstester) samt Cinebench ligger väldigt nära varandra i resultat.

Alla dessa laster har väldigt hög L1-cache hit-rate och gör ingen I/O, d.v.s. de är mest ett mått på rå beräkningskraft i gynnsamma fall.

Sandy Bridge (2600K) har 45 % högre IPC jämfört med FX-8370.
Ivy Bridge (3770K) har 64 % högre IPC
Haswell (4790K) har 83 % högre IPC
Kaby Lake (7700K) har 101 % högre IPC.

Nu är detta Piledriver, 40 % är mot Excavator. Men för att ens nå Ivy Bridge måste man nå högre än 40 %, vilket i.o.f.s. Lisa Su hintat att man gjort (däremot var det 40 % som gällde genom hela presentationen vi diskuterar, har större förtroende för arkitekten än CEO i just detta fall).

Vidare: kolla vad Zen är. Man har till väldigt stor del sneglat på Intel och implementerat nästan alla de finesser som lagts till fram till Haswell. Finns endast en enda sak som framkommit så här långt som skulle lägga Zen högre än Haswell/Broadwell i IPC, Zen kan färdigställa fler mikro-ops per cykel än Haswell/Broadwell (lika många som Skylake).

Vad det gäller djup på out-of-order fönstret, bredd, cache-latens, m.m. så är Zen och Haswell väldigt lika.

Men Zen är mer optimerad för SMT (distributed schedulers, större cache fast högre latens i vissa lägen) medan Core är mer optimerad för enkeltrådfallet (central schedulers, mindre cache med högre bandbredd som möjliggör mer aggressiv prefetching).

Så gissar att när båda trådarna används kan mycket väl Zen matcha Haswell, det om det är en riktigt bra design (vilket verkar vara fallet). Enkeltrådfallet finns det liksom inget som pekar på att man skulle kunna matcha, enda möjligheten vore att Haswell har relativt stora svagheter men finns inga indikationer på att så är fallet (ingen konkurrent utom Apple kan som sagt ens matcha Sandy Bridge enkeltråd-IPC i detta läge)

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

SweClockers har tyvärr mest CPU-tester som främst testar flyttal och som skalar perfekt med kärnor, så lite svårt att se exakt hur enkeltrådprestanda står sig där.

Techreport har inte heller jättemycket tester som kör enkeltrådprestanda, men finns i alla fall fyra stycken så man vaskar bort de mest avvikande värdena.

Räknar man ut enkeltrådprestanda och sedan kompenserar för skillnad i frekvens för att få ett mått på hur IPC står sig mellan olika modeller ser man att alla fyra tester (de tre JS-testerna, som är en blandning av heltal och flyttal med p.g.a. JS-motor är främst heltalstester) samt Cinebench ligger väldigt nära varandra i resultat.

Alla dessa laster har väldigt hög L1-cache hit-rate och gör ingen I/O, d.v.s. de är mest ett mått på rå beräkningskraft i gynnsamma fall.

Sandy Bridge (2600K) har 45 % högre IPC jämfört med FX-8370.
Ivy Bridge (3770K) har 64 % högre IPC
Haswell (4790K) har 83 % högre IPC
Kaby Lake (7700K) har 101 % högre IPC.

Nu är detta Piledriver, 40 % är mot Excavator. Men för att ens nå Ivy Bridge måste man nå högre än 40 %, vilket i.o.f.s. Lisa Su hintat att man gjort (däremot var det 40 % som gällde genom hela presentationen vi diskuterar, har större förtroende för arkitekten än CEO i just detta fall).

Vidare: kolla vad Zen är. Man har till väldigt stor del sneglat på Intel och implementerat nästan alla de finesser som lagts till fram till Haswell. Finns endast en enda sak som framkommit så här långt som skulle lägga Zen högre än Haswell/Broadwell i IPC, Zen kan färdigställa fler mikro-ops per cykel än Haswell/Broadwell (lika många som Skylake).

Vad det gäller djup på out-of-order fönstret, bredd, cache-latens, m.m. så är Zen och Haswell väldigt lika.

Men Zen är mer optimerad för SMT (distributed schedulers, större cache fast högre latens i vissa lägen) medan Core är mer optimerad för enkeltrådfallet (central schedulers, mindre cache med högre bandbredd som möjliggör mer aggressiv prefetching).

Så gissar att när båda trådarna används kan mycket väl Zen matcha Haswell, det om det är en riktigt bra design (vilket verkar vara fallet). Enkeltrådfallet finns det liksom inget som pekar på att man skulle kunna matcha, enda möjligheten vore att Haswell har relativt stora svagheter men finns inga indikationer på att så är fallet (ingen konkurrent utom Apple kan som sagt ens matcha Sandy Bridge enkeltråd-IPC i detta läge)

Hur vet du att det inte blir mer än 40% när Ryzen är färdig?

Visa signatur

Coca Cola missbrukare Förbjuden dryck för mig pga diabetes
AMD älskare
Katt älskare

Permalänk
Medlem
Skrivet av AMD-FX:

Hur vet du att det inte blir mer än 40% när Ryzen är färdig?

IPC kommer högst troligtvis inte ändras. Endast frekvens. Cachestrukturen (som mycket väl kan vara väl avvägd) håller tillbaka IPC-potentialen, och cachen är spikad sedan flera år. De sista procenten i IPC blir för dyra helt enkelt.

Permalänk
Medlem
Skrivet av Yoshman:

SweClockers har tyvärr mest CPU-tester som främst testar flyttal och som skalar perfekt med kärnor, så lite svårt att se exakt hur enkeltrådprestanda står sig där. [...]
Sandy Bridge (2600K) har 45 % högre IPC jämfört med FX-8370.
Ivy Bridge (3770K) har 64 % högre IPC
Haswell (4790K) har 83 % högre IPC
Kaby Lake (7700K) har 101 % högre IPC.
[...]
Så gissar att när båda trådarna används kan mycket väl Zen matcha Haswell, det om det är en riktigt bra design (vilket verkar vara fallet). Enkeltrådfallet finns det liksom inget som pekar på att man skulle kunna matcha, enda möjligheten vore att Haswell har relativt stora svagheter men finns inga indikationer på att så är fallet (ingen konkurrent utom Apple kan som sagt ens matcha Sandy Bridge enkeltråd-IPC i detta läge)

Octane 2 borde ge svaret framöver. Här är några resultat från https://www.xataka.com/analisis/intel-core-i7-7700k-analisis-...

samt http://www.anandtech.com/show/10968/the-intel-core-i7-7700k-9...

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Serzarian:

Resultaten är ju inom felmarginalen både på Sweclockers och Guru3D.
Med andra ord är 4 kärnor fortfarande kung i spel, 8 trådar kan användas ibland och 8 kärnor är så gott om helt onödiga.

Vilken felmarginal?

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem

En stor anledning till att man kan få bra prestanda i höga inställningar och höga upplösningar med 6900K/6950X är dess minnesbandbredd och ren throughput, detta är ofta något som inte tas med i cpu tester alls vilket är en smula underligt. Man borde väl egentligen köra SLi/CF med de bästa korten och absolut max inställningar/upplösning i spel för att se hur hela plattformen presterar och inte bara isolera ren cpu prestanda.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Yoshman:

Sandy Bridge (2600K) har 45 % högre IPC jämfört med FX-8370.
Ivy Bridge (3770K) har 64 % högre IPC
Haswell (4790K) har 83 % högre IPC
Kaby Lake (7700K) har 101 % högre IPC.

Är det räknat på single-core ipc eller processorns ipc?

Visa signatur

ASUS Prime RX 9070 XT 16GB OC | AMD Ryzen R7 5700X3D | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury 2x16GB 3600 CL 16 Renegade | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | Xiaomi G34WQi | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair HS65 |

Permalänk
Hjälpsam

Med tanke på AMD:s satsning på HSA, tycker jag att det är lite konstigt att de inte har en iGPU i Ryzen.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem

Nu börjar det trilla in mer och mer

http://www.thecountrycaller.com/68010-amd-ryzen-and-vega-demo...

Citat:

Advanced Micro Devices, Inc. (NASDAQ:AMD) has set up demo stations at CES 2017. Once again the red team is pairing its two highly-anticipated products to show off its unique standing in catering to both CPU and GPU markets.

The demo station has a Ryzen CPU paired with an unknown Vega GPU running Star Wars Battlefront at 4K 60FPS. You might be able to recall that the same test was demonstrated at AMD’s New Horizon event last month. The video provided courtesy ThinkComputers shows the 8-core Ryzen and Vega handling the game smoothly at a rock-solid 60FPS.

Med film https://www.youtube.com/watch?v=fkvj-uij42M

På kinesiska http://www.4gamer.net/games/300/G030061/20170104006/

Lite svårt att sitta still just nu...

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|