Permalänk
Medlem
Skrivet av Yoshman:

Hur är AVX irrelevant när det något som 15-20 % av servermarknaden använder, d.v.s. den del av servermarknaden som innefattar vetenskapliga beräkningar? För vetenskapliga beräkningar ger 256-bitars bred AVX pipeline väldigt nära dubbla prestanda per kärna och cykel över SSE.

Givetvis menar jag OEM och skrivbordsdatorer nu. På servermarknaden så har AMD sina beräkningskort, och det är antagligen därför tillsammans med APU/HSA/Infinity Fabric initiativet som man skippar AVX i processorerna. En större flyttalsenhet kan dock dyka upp i Zen+, och 7nm verkar AMD bli före Intel med. Då får man plats med mycket godis...

Citat:

Håller däremot med om att väldigt få "normala" användare har någon nytta av AVX, men de har inte heller nytta av en CPU med åtta kärnor vare sig den kommer från AMD eller Intel.

Det kan du inte generalisera om. Allt på skrivbordet blir mer och mer flertrådat, men framför allt så är 8 kärnor väldigt användbart för t.ex alla som sitter med produktion av video/musik. När man köpte en 2600K så hade knappast marknaden som den var inriktad till någon nytta av 8 trådar heller för dom flesta användare, men idag händer det att dom används rätt flitigt, inte minst i spel där man sett större ökningar än vad man kunde vänta sig. Det fanns tom ett hat mot SMT i samband med spel för att man ofta fick negativ prestanda. Min poäng; det har vänt totalt och fortsätter göra så på konsumentsidan. Vulkan och DX12 och alla konsolportar hjälper till att rulla snöbollen desto snabbare också.

Citat:

Skylake är också större p.g.a. att L2$ och L3$ är dual-portad medan den är singelportad på Zen.

Får se vilken betydelse det får. Storlek är något man vill hålla nere som vi bägge känner till. Zen har dubbelt så stor L2 cache med dubbelt så hög associativitet samt dubbelt så stor L1i för att argumentera ren storlek. Såg också ditt föregående inlägg ang cache. Det inlägget tillsammans med fler tidigare inlägg som relaterar till cache behöver ju inte alls stämma på Zen. Cachearkitekturen designas ju efter resten av hur arkitekturen är uppbyggd för att på bästa vis mata kärnorna tillsammans med hänsyn till andra faktorer som tillverkningskostnad, komplexitet och energieffektivitet. Bara för att man minskade latensen med en mindre L2 cache på Core så behöver inte det betyda att man får samma fenomen på Zen. Zen drar förmodligen stor nytta av en större L2 cache där Intel är mer beroende av sin L3 cache. Vi kan se i många befintliga designer bakåt i tiden som fått extremt stora ökningar av större L2 cache. Speciellt spel som ofta är extremt cacheberoende.

Citat:

Vidare har Skylake (hela Core-serien) en centraliserad schemaläggare för instruktioner medan Zen har en distribuerad schemaläggare som är betydligt enklare att realisera i kisel (alla dagens out-of-order ARM-designer kör med detta). Och Skylake har större out-of-order fönster, två extra pipelines för minnesoperationer samt större registerbank.

Och så finns det designer som POWER som kör med dedikerade schemaläggare/köer. Det behöver inte betyda att det endast gynnar server/HPC applikationer i en design som Zen. Det är trots allt många faktorer som saknas om Zen som är väldigt avgörande för dess prestanda också. Zen ser starkare ut än vad jag hade kunnat vänta mig inledningsvis om jag ska vara ärlig. Att ta ikapp det enorma gapet och lansera något som upprör en jätte som Intel är förmodligen bara AMD som kan göra också. Kör AMD och Intel fair-fight nu utan massa mutor osv som Intel bl.a höll på med med så tror jag att Intel kan få det mycket tufft.

Förstår inte riktigt om du menar att jag är en del av detta hype-train heller. Försökt hålla mig skeptisk och saklig med källor eller en argumentation bakom.

Står också fast vid att min liknelse ang XFR i förhållande till GPU'er är betydligt mer lik än något annat vi sett tidigare i form av speedstep/turbo.

Som du själv säger, vi är så nära lansering att man kan sluta spekulera, men det har också varit syftet med tråden och vi kom rätt långt tillsammans med att få fram olika data här och bolla runt den tills helvetet frös till is

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Yoshman:

En artikel om Zen som fram till nu legat bakom en pay-wall.

Det som är viktigt med denna artikel är vem som är författare, David Kanter. Hans analyser och även spekulationer av CPU-designer brukar vara extremt träffsäkra!

Vad jag finner mest intressant, även om det är spekulation, är uppskattning av SPECInt_rate för Zen kontra Core-serien.
http://i.imgur.com/QfPKrR0.png
"rate" i namnet säger att det rör sig om heltalsprestanda när alla trådar är aktiva. Hade varit än mer spännande att se en gissning på SPECInt, d.v.s. enkeltrådprestanda, men är å andra sidan inte så många veckor kvar innan vi inte ens behöver spekulera.

Har själv flackat lite i gissning kring vad IPC för Zen kan hamna, allt från Sandy Bridge till Haswell. Min senaste gissning i denna tråd är att man hamnar närmst Ivy Bridge och det verkar även vara Kanters spekulation. Så håller fast vid den gissning till facit delas ut om tre-fyra veckor.

I artikeln nämns att det starkaste området för Zen lär bli kod som utnyttjar SSE samt jobbar med skalära flyttal. Det är exakt fallet för Blender!

Nu skruvar vi upp hype-reglagen till 11:D

AMD säger att de ökat IPC med mer än 40%.
Författaren som brukar ha rätt säger att Zen på 3,7GHz är 144, Haswell (4GHz) 170 och Skylake (4GHz) är 190. Men han medger också att Haswell och skylake har 10% för höga resultat pga optimeringar.
AMD Shanghai säger att det finns en modell med 4,2 GHz basklocka.

Vi byter ut värdena i formlerna lite, 40% blir 45%, 3,7GHz blir 4,2 och Intel räknas ned med sin benchmarkoptimering och plötsligt blir det väldigt, väldigt intressant...

Förstår jag artikeln rätt att det finns 3 bussar om 32Byte mellan de olika delarna i L1 och L2 (instruktioner, data och µop-cache) och en 32Byte stor buss mellan L2 och L3? Och har inte Intel "bara" 2 delar (instruktioner + data) i L1?

Permalänk
Medlem

sedan han gjorde analysen i augusti, så har AMD ökat IPC från 40% till 53%.

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Medlem

@SectionX2:
Har du någon källa på 53%?

Permalänk
Datavetare
Skrivet av Enigma:

Och så finns det designer som POWER som kör med dedikerade schemaläggare/köer. Det behöver inte betyda att det endast gynnar server/HPC applikationer i en design som Zen. Det är trots allt många faktorer som saknas om Zen som är väldigt avgörande för dess prestanda också.

Det är sant, POWER 8 har distribuerad schemaläggare, där lämnar också upp till 10 instruktioner (mot 6 i Skylake och Zen) front-end per cykel och det finns totalt 16 pipelines i backend (väldigt välvilligt räknat blir det 10 i Zen).

Ändå matchar inte POWER8 enkeltrådprestanda i Haswell, än mindre Skylake.

Skrivet av Enigma:

Står också fast vid att min liknelse ang XFR i förhållande till GPU'er är betydligt mer lik än något annat vi sett tidigare i form av speedstep/turbo.

Och det har jag aldrig invänt mot. Min invändning var att XFR skulle kunna klocka kretsen i princip hur högt som helst bara det finns kylning nog.

Mitt 970 har en specificerad turbo på 1279 MHz. Har två 120 mm fläktar riktad rakt mot kortet så GPU-fläktarna går sällan över 30-40 % av maxkapacitet. Frekvensen ligger spikad på (tror det är) 1350 MHz, det oavsett hur mycket kylning man vräker på med. Ändras inte en MHz uppåt även om man drar alla fläktar till 100 %.

XFR kommer fungera exakt på det sättet.

D.v.s. det enda "magiska" är att Nvidia/MSI vägrar skriva den maximala i produktbladet, annars är det exakt samma sak som turbo-boost. I så fall är ARM magiska också, där får man bara max turbo med de brukar vägra uppge basfrekvens.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Och det har jag aldrig invänt mot. Min invändning var att XFR skulle kunna klocka kretsen i princip hur högt som helst bara det finns kylning nog.

Mitt 970 har en specificerad turbo på 1279 MHz. Har två 120 mm fläktar riktad rakt mot kortet så GPU-fläktarna går sällan över 30-40 % av maxkapacitet. Frekvensen ligger spikad på (tror det är) 1350 MHz, det oavsett hur mycket kylning man vräker på med. Ändras inte en MHz uppåt även om man drar alla fläktar till 100 %.

XFR kommer fungera exakt på det sättet.

D.v.s. det enda "magiska" är att Nvidia/MSI vägrar skriva den maximala i produktbladet, annars är det exakt samma sak som turbo-boost. I så fall är ARM magiska också, där får man bara max turbo med de brukar vägra uppge basfrekvens.

Även om det finns kylning så måste ju kortet vara stabilt, alltså ha tillräckligt med spänning. Det gäller väl samma sak där med AMD och deras processorer, även om kylningen räcker så kanske dom inte vågar mata på tillräckligt med spänning för att vara 100% säkert att det är stabilt i höga klocks så det kommer ju inte bara klocka upp processorerna så länge tempsen tillåter, det säger ju sig själv.

Ger du kortet mer spänning manuellt så kommer det klocka upp lite extra automatiskt, det gör i alla fall mitt 970.

Fan vad förvirrande mitt inlägg blev. Hoppas det går att förstå i alla fall.

Visa signatur

sweclockers prestandaindex

Efter 10 kommer 11.
Efter 99 kommer 100.

Permalänk
Medlem
Skrivet av Yoshman:

Det är sant, POWER 8 har distribuerad schemaläggare, där lämnar också upp till 10 instruktioner (mot 6 i Skylake och Zen) front-end per cykel och det finns totalt 16 pipelines i backend (väldigt välvilligt räknat blir det 10 i Zen).

Ändå matchar inte POWER8 enkeltrådprestanda i Haswell, än mindre Skylake.

Lite väl hårt att kanske jämföra en RISC mot en CISC arkitektur rakt av bara för att dom har designmässigt extremt många likheter. Enkeltrådad prestanda berörs ju av väldigt många andra faktorer.

Citat:

Och det har jag aldrig invänt mot. Min invändning var att XFR skulle kunna klocka kretsen i princip hur högt som helst bara det finns kylning nog.

Mitt 970 har en specificerad turbo på 1279 MHz. Har två 120 mm fläktar riktad rakt mot kortet så GPU-fläktarna går sällan över 30-40 % av maxkapacitet. Frekvensen ligger spikad på (tror det är) 1350 MHz, det oavsett hur mycket kylning man vräker på med. Ändras inte en MHz uppåt även om man drar alla fläktar till 100 %.

XFR kommer fungera exakt på det sättet.

D.v.s. det enda "magiska" är att Nvidia/MSI vägrar skriva den maximala i produktbladet, annars är det exakt samma sak som turbo-boost. I så fall är ARM magiska också, där får man bara max turbo med de brukar vägra uppge basfrekvens.

Jag tror vi bägge vet att XFR inte är något magiskt, däremot något nytt! AVFS är kraftigt uppdaterad och vi ser en mer sofistikerad version av all sensordata som plockas i kislet på Zen. Det finns ett dynamiskt tak som baseras på algoritmer och sensordata, det är det jag menar. Zen ska tydligen inte ha en TDP-gräns med XFR aktiverad, åtminståne så ska det vara valbart och det är också en funktion som är modellspecifik per SKU.

Ditt grafikkort jobbar med sensordata och tables, därav den har ett maximalt värde. XFR verkar gå steget längre med fullt dynamiska "tak" beroende på kylning och data från det fysiska kislet genom AVFS v.3.

Lite mer om AVFS och att det inte är något förprogrammerat table:

https://www.extremetech.com/extreme/199654-amds-carrizo-highe...

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Enigma:

Lite väl hårt att kanske jämföra en RISC mot en CISC arkitektur rakt av bara för att dom har designmässigt extremt många likheter. Enkeltrådad prestanda berörs ju av väldigt många andra faktorer.

Jag tror vi bägge vet att XFR inte är något magiskt, däremot något nytt! AVFS är kraftigt uppdaterad och vi ser en mer sofistikerad version av all sensordata som plockas i kislet på Zen. Det finns ett dynamiskt tak som baseras på algoritmer och sensordata, det är det jag menar. Zen ska tydligen inte ha en TDP-gräns med XFR aktiverad, åtminståne så ska det vara valbart och det är också en funktion som är modellspecifik per SKU.

Ditt grafikkort jobbar med sensordata och tables, därav den har ett maximalt värde. XFR verkar gå steget längre med fullt dynamiska "tak" beroende på kylning och data från det fysiska kislet genom AVFS v.2.

Lite mer om AVFS och att det inte är något förprogrammerat table:

https://www.extremetech.com/extreme/199654-amds-carrizo-highe...

Tycker inte XFR är så speciellt. Ta t.ex. en i7 6900K 3,2-4GHz på 140W TDP. Ge den nu officiellt en turbo på låga 3,5GHz istället och sänk TDP-utrymmet till 100W. Sedan får du istället en BIOS-inställning som heter XFR som kan ta bort TDP-spärren och tillåta Turbo upp till 4GHz istället för det officiella 3,5GHz. Färdigt!

Folk vill få det att låta som att den kan gå så högt som kylningen tillåter, men man vill inte ha en dator som blir instabil bara för att man råkar ha bra kylning så att XFR drar upp den i 5,5GHz där den kraschar av instabilitet. De kommer bara fläska på med frekvenser och spänningar som AMD validerat den för.

Vore dock roligt om varje processor fick individuella max på dessa som bestäms efter AMDs egna automatiserade tester av varje krets. I så fall vore det verkligen unikt och nyskapande, men jag är inte direkt övertygad om att så är fallet.

Permalänk
Medlem
Skrivet av Aleshi:

Tycker inte XFR är så speciellt. Ta t.ex. en i7 6900K 3,2-4GHz på 140W TDP. Ge den nu officiellt en turbo på låga 3,5GHz istället och sänk TDP-utrymmet till 100W. Sedan får du istället en BIOS-inställning som heter XFR som kan ta bort TDP-spärren och tillåta Turbo upp till 4GHz istället för det officiella 3,5GHz. Färdigt!

Folk vill få det att låta som att den kan gå så högt som kylningen tillåter, men man vill inte ha en dator som blir instabil bara för att man råkar ha bra kylning så att XFR drar upp den i 5,5GHz där den kraschar av instabilitet. De kommer bara fläska på med frekvenser och spänningar som AMD validerat den för.

Vore dock roligt om varje processor fick individuella max på dessa som bestäms efter AMDs egna automatiserade tester av varje krets. I så fall vore det verkligen unikt och nyskapande, men jag är inte direkt övertygad om att så är fallet.

Och det är förstås baserat på den jämförelse du gör som är helt tagen ur luften då du inte fått se en officiell presentation av XFR, och du tar inte hänsyn över det man också känner till hittills, att XFR jobbar med hårdvara som inte existerar i någon Intel-CPU. XFR är inte Intel's turbo och det är inte AMD's turbofunktion Precision Boost heller. Läs länken först postad i inlägget innan och se först vad AVFS är. Titta sen närmare på dom senaste slides som jag la upp. Att det fortfarande är folk som inte förstår att XFR är ett lager som jobbar ovanpå turbo förstår jag inte. Men men, Dresdenboy är säkert också ute och cyklar:

Citat:

For their XFR stuff they might use other sensors than some kind of temperature sensor, as for example a 14nm process based ring oscillator or chain of inverters with some additional logic might give you information about how close to the chips' limits you are in just nanoseconds.

Jag säger inte att XFR är bu eller bä, utan förhåller mig till det som man hittills ser. Jag är färdig med diskussionen då jag tatt upp det tillräckligt många gånger tidigare i tråden så citera på du.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Datavetare
Skrivet av Enigma:

Lite väl hårt att kanske jämföra en RISC mot en CISC arkitektur rakt av bara för att dom har designmässigt extremt många likheter. Enkeltrådad prestanda berörs ju av väldigt många andra faktorer.

Jag tror vi bägge vet att XFR inte är något magiskt, däremot något nytt! AVFS är kraftigt uppdaterad och vi ser en mer sofistikerad version av all sensordata som plockas i kislet på Zen. Det finns ett dynamiskt tak som baseras på algoritmer och sensordata, det är det jag menar. Zen ska tydligen inte ha en TDP-gräns med XFR aktiverad, åtminståne så ska det vara valbart och det är också en funktion som är modellspecifik per SKU.

Ditt grafikkort jobbar med sensordata och tables, därav den har ett maximalt värde. XFR verkar gå steget längre med fullt dynamiska "tak" beroende på kylning och data från det fysiska kislet genom AVFS v.2.

Lite mer om AVFS och att det inte är något förprogrammerat table:

https://www.extremetech.com/extreme/199654-amds-carrizo-highe...

Både AMD och Intels high-end x86 är rena RISC:ar i sin back-end, så det är rätt jämförbart med POWER. Den stora skillnaden ligger i att x86 har en minneskonsistensmodell som är väldigt komplex att implementera både effektivt och korrekt (det trevliga är att x86 är väldigt mycket enklare att förstå som programmerare just när det kommer till minneskonsistens för multicore).

Säger inte heller att det är en tabell, säger att vare sig XFR eller motsvarande i GPU kommer aldrig köra en frekvens som inte tillverkaren validerat kretsen på, det oavsett kylning, strömbudget, sensorer, ångtryck på hype-train, etc.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@Gruarn: Inte direkt från AMD, men från industry insiders.

Lisa Su säger dock att AMD has exceeded 40%.

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Medlem
Skrivet av Enigma:

Och det är förstås baserat på den jämförelse du gör som är helt tagen ur luften då du inte fått se en officiell presentation av XFR, och du tar inte hänsyn över det man också känner till hittills, att XFR jobbar med hårdvara som inte existerar i någon Intel-CPU. XFR är inte Intel's turbo och det är inte heller AMD's turbofunktion Precision Boost heller. Läs länken först postad i inlägget innan och se först vad AVFS är. Titta sen närmare på dom senaste slides som jag la upp.

Jag säger inte att XFR är bu eller bä, utan förhåller mig till det som man hittills ser. Jag är färdig med diskussionen då jag tatt upp det tillräckligt många gånger tidigare i tråden så citera på du.

Det där är detaljer. Ja AMD verkar ha gjort ett jättebra jobb med att kunna finjustera frekvenser och spänning optimalt på olika delar över hela CPUn. Och detta skiljer sig från hur Intel går till väga. Men detta gäller även Turbon upp till officiella turbo-frekvenser eller hur? Det är inte unikt för när XFR-läget är aktiverat, detta är ju aktivt i normala Turbo-området också. XFR tillåter ju bara att detta tas vidare in i inofficiella frekvenser utan något TDP-tak. Det betyder ju dock inte att dessa inofficiella frekvenser och spänningar är ickevaliderade frekvenser eller spänningar, eller hur?
XFR kommer inte gå högre i spänningar eller frekvenser än vad AMD bestämt sedan innan. Det är bara att max-turbon är inofficiell.

Permalänk
Medlem
Skrivet av Yoshman:

Både AMD och Intels high-end x86 är rena RISC:ar i sin back-end, så det är rätt jämförbart med POWER. Den stora skillnaden ligger i att x86 har en minneskonsistensmodell som är väldigt komplex att implementera både effektivt och korrekt (det trevliga är att x86 är väldigt mycket enklare att förstå som programmerare just när det kommer till minneskonsistens för multicore).

Säger inte heller att det är en tabell, säger att vare sig XFR eller motsvarande i GPU kommer aldrig köra en frekvens som inte tillverkaren validerat kretsen på, det oavsett kylning, strömbudget, sensorer, ångtryck på hype-train, etc.

Vad är en CPU utan dess front-end som dessutom innefattar betydligt mer än bara avkodningen av RISC vs CISC? Stora skillnader... Nåväl, detta är överkurs relaterat till Ryzen. Likaväl med XFR där jag lagt till betydligt mer argumentation och jämförelser tidigare. Ingen idé att upprepa saker som inte uppfattas i ett massivt off-topic flöde. Tråden har gjort sitt iaf hoppas jag!

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Yoshman:

Slutligen. Var initialt en hel del kritik mot Intels val att gå från 3-6 MB L2$ i Core2 till 256 kB L2$ i Nehalem, kritiken tystnade rätt snabbt när prestandaresultaten ramlade in. Att storleken på L2$ minskade vägdes med råge upp i nästan 100 % av fallen då latensen blev ca 30 % lägre.

Vägdes inte det upp av L3$ i Nehalem, som var mycket större än L2$. Såvitt jag vet hade inte Core2 L3$.

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Datavetare
Skrivet av FishTank:

Vägdes inte det upp av L3$ i Nehalem, som var mycket större än L2$. Såvitt jag vet hade inte Core2 L3$.

L3$, framförallt i Nehalem, har högre latens än L2$ i Core 2 (och betydligt högre än L2$ i Nehalem). Rätt säker att vissa Core 2 Xeons hade L3$, men för vanliga desktop-program lär knappast L3$ gjort någon nytta på den tiden då rimligen satt på RAM-sidan om FSB -> hög latens.

En annan sak är att bandbredd mot RAM har ökat mycket snabbare än CPU-prestanda, i alla fall på desktop där antal CPU-kärnor inte ökat så mycket. Den bandbredden + L3$ har gjort det möjligt att vara mycket mer aggressiv med prefetch. Med ofta korrekt spekulerade prefetch-beslut blir effekten densamma som en större L1$/L2$ som har den låga latens den faktiska storleken ger.

Ser man också i Ryzen. AMD har ju pratat väldigt mycket om hur man jobbat med att optimera prefetching där man designade Zen.

Många spel ser i.o.f.s. boost av L4$, fast de ser också nytta med högre bandbredd mot RAM så gissar därför att den primära effekten L4$ ger är att dra upp genomsnittlig bandbredd mot RAM. Är väldigt hög latens mot L4$, den ligger betydligt närmare RAM än L3$ vilket nog förklarar varför de flesta program ser noll effekt av L4$ (finns vissa som till och med ser en svag negativ effekt).

Existerar idag Skylake Xeon E3 med eDRAM (är inte längre rent tekniskt en L4$), men har tyvärr inte sett några spelbenchmarks med den. Möjligheten finns att L4$ faktiskt inte ger något ens för spel när man kör med riktigt snabba DDR4 minnen, fast utan tester är det omöjligt att veta.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Känner någon till om AMD har en APU ZEN på gång med HBM minne? Får de ut en sådan borde det bli en storsäljare

Permalänk
Medlem
Skrivet av klk:

Känner någon till om AMD har en APU ZEN på gång med HBM minne? Får de ut en sådan borde det bli en storsäljare

Inget bekräftat såklart men det ryktas om två Zen APUer med Vega grafik. En med 16 CUs och HBM till desktop och en med 12 CUs utan HBM (DDR4) till laptop.

http://www.bitsandchips.it/52-english-news/7622-rumor-two-ver...

/Knight

EDIT: Personligen tror jag det kommer Zen+Vega+HBM men jag tror inte det blir som ryktet ovan säger. Jag tror det kommer med HBM till påkostade laptops/desktops och jag tror det kommer utan HBM till billiga laptops/desktops.

Visa signatur

Idag kom Athlon64

Permalänk
Medlem

65W modellen 3.7 GHz ute i det fria igen. Lägg märke till att de kallar det för TDP/ACP. (https://en.wikipedia.org/wiki/Average_CPU_power)

-------------
En sida till, med alla 3 SKUs, de verkar ha missat "X" på 1800 på denna, men bara i namnet, inte i betäckningen "YD180XBCAEWOF".
https://dgxtech.com/sales/amd-ryzen-7-1700-3-7ghz-8-core-65w-...
https://dgxtech.com/sales/amd-ryzen-7-1800-4-0ghz-8-core-95w-...
https://dgxtech.com/sales/amd-ryzen-7-1700x-3-8ghz-8-core-95w...

-------------

http://www.hardwareschotte.de/preisvergleich/Amd-Ryzen-7-1700...

AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
im HardwareSchotte Preisvergleich

Prozessor
Hersteller: AMD
Prozessor-Info: Summit Ridge Octa-Core (8C/16T)
Prozessortakt: 3,7 GHz
Verlustleistung (TDP/ACP): 65 Watt
CPU-Sockel: Sockel AM4
Verpackungsversion: Boxed
Speicherkontroller: Dual-Channel DDR4-2400

Produktdatenblatt
für Prozessor AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
zu den Preisen
Hersteller AMD, www.amd.com/de
Artikelnummer des Herstellers YD1700BBAEBOX
Allgemeines
CPU-Kerne Octa-Core
Prozessortakt 3,7 GHz
Verlustleistung (TDP/ACP) 65 Watt
CPU-Sockel Sockel AM4
Systembus 5.0 GT/s DMI
Microarchitectur
Prozessor-Info Summit Ridge Octa-Core (8C/16T)
Fertigungsprozess 14 nm
L1-Cache 8x 64 KiB
L2-Cache 8x 512 KiB
L3-Cache 16 MiB
Features MMX(+) (Befehlssatz) • SSE (Streaming SIMD Erweiterung) • SSE2 • SSE3 • SSSE3 (Intel SSE4) • SSE4a (AMD SSE4) • SSSE4.1 • SSSE4.2 • AES (Ver- und Entschlüsselung) • ABM (Advanced Bit Manipulation) • AVX (Vektor Grafik Erweiterung) • FMA3 • FMA4 • F16C (Gleitkomma-Konvertierung) • XOP (eXtended Operations) • SMT (Simultaneous Multithreading) • SMP (Symmetrisches Multiprozessorsystem) • AMD-V (Compute Virtualisierung) • VT-d/Vi (I/O MMU Virtualisierung) • x86-64/EM64T (64Bit Prozessor) • NX-Bit/XD-Bit (Virenschutz) • EVP (erweiterter Virenschutz) • TBT 3.0 (Turbo Core 3.0)
Energiesparfunktionen Cool'n'Quiet • CoolCore Technology • Enhanced Halt State (C1E) • Deep Power Down (C6)
Integrierte Peripherien
Speicherkontroller Dual-Channel DDR4-2400
Ausstattung
Verpackungsversion Boxed
Variante Box mit Wraith Kühler
Herstellergarantie 3 Jahre
Produktseite beim Hersteller Produktlink melden
Quelle HardwareSchotte.de
Verwandte Seiten Sockel AM4 AMD Prozessoren, AMD Prozessor-Preisvergleich
weitere Informationen
• energieeffizententer AMD Ryzen 8-Kern Prozessor mit ZEN Architektur mit leisem Wraith Kühler
• Diese CPU besitzt keinen fest eingestellten Multiplikator, ähnlich der Black Edition von AMD.
• 8 Kerne mit insgesamt 16 Rechenkernen bei bis zu 3,7 GHz Takt
• AMD Ryzen Prozessoren haben keinen festen Turbo-Takt - der maximale Turbo-Takt ist von der Kühlung abhängig.

Lade till länk till ACP. Råkade skriva 3.8, ska vara 3.7.
Visa signatur

[1700X] [B350 mITX] [32GB DDR4@3000MHz CL15] [Vega 56] [Nano S] [D15S] [Win 10 Pro]

Permalänk
Medlem
Skrivet av HenKenny:

65W modellen 3.8 GHz ute i det fria igen. lägg märke till att det kallar det för TDp/ACP.

http://www.hardwareschotte.de/preisvergleich/Amd-Ryzen-7-1700...

AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
im HardwareSchotte Preisvergleich

Prozessor
Hersteller: AMD
Prozessor-Info: Summit Ridge Octa-Core (8C/16T)
Prozessortakt: 3,7 GHz
Verlustleistung (TDP/ACP): 65 Watt
CPU-Sockel: Sockel AM4
Verpackungsversion: Boxed
Speicherkontroller: Dual-Channel DDR4-2400

Produktdatenblatt
für Prozessor AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
zu den Preisen
Hersteller AMD, www.amd.com/de
Artikelnummer des Herstellers YD1700BBAEBOX
Allgemeines
CPU-Kerne Octa-Core
Prozessortakt 3,7 GHz
Verlustleistung (TDP/ACP) 65 Watt
CPU-Sockel Sockel AM4
Systembus 5.0 GT/s DMI
Microarchitectur
Prozessor-Info Summit Ridge Octa-Core (8C/16T)
Fertigungsprozess 14 nm
L1-Cache 8x 64 KiB
L2-Cache 8x 512 KiB
L3-Cache 16 MiB
Features MMX(+) (Befehlssatz) • SSE (Streaming SIMD Erweiterung) • SSE2 • SSE3 • SSSE3 (Intel SSE4) • SSE4a (AMD SSE4) • SSSE4.1 • SSSE4.2 • AES (Ver- und Entschlüsselung) • ABM (Advanced Bit Manipulation) • AVX (Vektor Grafik Erweiterung) • FMA3 • FMA4 • F16C (Gleitkomma-Konvertierung) • XOP (eXtended Operations) • SMT (Simultaneous Multithreading) • SMP (Symmetrisches Multiprozessorsystem) • AMD-V (Compute Virtualisierung) • VT-d/Vi (I/O MMU Virtualisierung) • x86-64/EM64T (64Bit Prozessor) • NX-Bit/XD-Bit (Virenschutz) • EVP (erweiterter Virenschutz) • TBT 3.0 (Turbo Core 3.0)
Energiesparfunktionen Cool'n'Quiet • CoolCore Technology • Enhanced Halt State (C1E) • Deep Power Down (C6)
Integrierte Peripherien
Speicherkontroller Dual-Channel DDR4-2400
Ausstattung
Verpackungsversion Boxed
Variante Box mit Wraith Kühler
Herstellergarantie 3 Jahre
Produktseite beim Hersteller Produktlink melden
Quelle HardwareSchotte.de
Verwandte Seiten Sockel AM4 AMD Prozessoren, AMD Prozessor-Preisvergleich
weitere Informationen
• energieeffizententer AMD Ryzen 8-Kern Prozessor mit ZEN Architektur mit leisem Wraith Kühler
• Diese CPU besitzt keinen fest eingestellten Multiplikator, ähnlich der Black Edition von AMD.
• 8 Kerne mit insgesamt 16 Rechenkernen bei bis zu 3,7 GHz Takt
• AMD Ryzen Prozessoren haben keinen festen Turbo-Takt - der maximale Turbo-Takt ist von der Kühlung abhängig.

Översatt: https://translate.google.se/translate?sl=auto&tl=en&js=y&prev...

Citat:

AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
In the HardwareSchotte price comparison

processor
Manufacturer: AMD
Processor Info: Summit Ridge Octa Core (8C / 16T)
Process location: 3.7 GHz
Power dissipation (TDP / ACP): 65 watts
CPU socket: AM4 socket
Packing: Boxed
Memory Controller: Dual-Channel DDR4-2400

Product data sheet
For Processor AMD Ryzen 7 1700 Wraith Spire Box (YD1700BBAEBOX)
To the prices
Manufacturer AMD, www.amd.com/en
Part number of manufacturer YD1700BBAEBOX
General information
CPU cores Octa core
Process location clock 3.7 GHz
Power dissipation (TDP / ACP) 65 watts
CPU socket socket AM4
System Bus 5.0 GT / s DMI
Microarchitecture
Processor Info Summit Ridge Octa Core (8C / 16T)
Production process 14 nm
L1 cache 8x 64 KiB
L2 cache 8x 512KiB
L3 cache 16 MiB
Features MMX (+) (command set) • SSE (Streaming SIMD extension) • SSE2 • SSE3 • SSSE3 (Intel SSE4) • SSE4a (AMD SSE4) • SSSE4.1 • SSSE4.2 • AES (encryption and decryption) • ABM Advanced Bit Manipulation) • AVX (vector graphics extension) • FMA3 • FMA4 • F16C (floating point conversion) • XOP (eXtended Operations) • SMT (Simultaneous Multithreading) • SMP (Symmetric Multiprocessor) • AMD-V (Compute Virtualization) -d / Vi (I / O MMU virtualization) • x86-64 / EM64T (64Bit processor) • NX bit / XD bit (virus protection) • EPP (advanced virus protection) • TBT 3.0 (Turbo Core 3.0)
Energy-saving features Cool'n'Quiet • CoolCore Technology • Enhanced HaltState (C1E) • Deep Power Down (C6)
Integrated peripherals
Memory Controller Dual-Channel DDR4-2400
equipment
Packing Version Boxed
Variant box with Wraith cooler
Manufacturing guarantee 3 years
Report this product to the manufacturer
Source HardwareSchotte.de
Related Pages Socket AM4 AMD processors, AMD processor price comparison
Further information
• energy-efficient AMD Ryzen 8 core processor with ZEN architecture with a quiet Wraith cooler
• This CPU does not have a fixed multiplier, similar to the AMD Black Edition.
• 8 cores with a total of 16 cores at up to 3.7 GHz clock
• AMD Ryzen processors do not have a fixed turbo cycle - the maximum turbo cycle depends on cooling.

Annan artikel från samma sida: https://translate.google.se/translate?sl=auto&tl=en&js=y&prev...

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Medlem

"AMD Ryzen processors do not have a fixed turbo cycle - the maximum turbo cycle depends on cooling."

Visa signatur

[1700X] [B350 mITX] [32GB DDR4@3000MHz CL15] [Vega 56] [Nano S] [D15S] [Win 10 Pro]

Permalänk
Inaktiv

Men var är all DRM, jag trodde halva chipet skulle bestå av detta.
Skämt, jag saknar ECC. VT-d/Vi trodde jag var Intels namn på dessa viktiga funktioner.

Permalänk
Medlem
Skrivet av Knightmare:

Inget bekräftat såklart men det ryktas om två Zen APUer med Vega grafik. En med 16 CUs och HBM till desktop och en med 12 CUs utan HBM (DDR4) till laptop.

http://www.bitsandchips.it/52-english-news/7622-rumor-two-ver...

/Knight

EDIT: Personligen tror jag det kommer Zen+Vega+HBM men jag tror inte det blir som ryktet ovan säger. Jag tror det kommer med HBM till påkostade laptops/desktops och jag tror det kommer utan HBM till billiga laptops/desktops.

Tack! Det vore grymt om de kunde få fram något där den blir tillräckligt kraftfull för att köra hyffsat tunga spel på någorlunda hög upplösning. Tror det är många som vi slippa en stor datorlåda och istället väljer en barebone.

Permalänk
Medlem
Skrivet av anon159643:

Men var är all DRM, jag trodde halva chipet skulle bestå av detta.
Skämt, jag saknar ECC. VT-d/Vi trodde jag var Intels namn på dessa viktiga funktioner.

ECC borde stå som en feature under "Speicherkontroller", som kanske bara är torftigt beskriven. Så det kanske inte saknas bara för att det inte står listat med processorns features. Men det är allt lite oroande.

AMD-V motsvarar intels VT-x, AMD-Vi motsvarar VT-d. Så "VT-d/Vi" är en förvirrande benämning, men jag tolkar den som att funktionen finns. Evt har återförsäljarsajten "VT-d/Vi" som en egen sökkategori för att underlätta jämförelser mellan Intel- och AMD-CPUer.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Permalänk
Medlem

Jag har inte 100% koll på vad som skrivits på alla sidor, men CoolerMaster har också kylare för AM4.
http://www.coolermaster.com/cooling/cpu-liquid-cooler/masterl...

Visa signatur

Akashiro 0.9: Ryzen 5 7600, Radeon RX 7800XT Pure: 64/2000
https://podcasters.spotify.com/pod/show/thomaseron

Permalänk
Medlem

Nu har jag inte hittat någon info om detta någon vart så tänkte om någon har hört något:

Intel har nån teknik där en/eller några utvalda kärnor klockas högre, tror det är på deras processorer som har många och lägre clockade kärnor - Vad heter det?

Eftersom att Zen är uppbyggd i två moduler och det finns vissa kombinationer för hur kärnorna kan vara aktiva - t.ex
4+4 =8c eller
3+3, 4+2 =6c etc.

Finns det en möjlighet att köra det ena CCXet på en betydligt högre frekvens än det andra? Tänker mig att 4c i 4+GHz och de andra 4 i ca 3GHz - det kan leda till bra prestanda i spel, samtidigt som strömförbrukningen lär gå ned rejält.

Vore riktigt trevlig, framförallt på 6c varianten, om den är placerad 4+2 att köra det ena klustret i betydligt högre frekvenser. Detta hjälper något enormt för de äldre spelen som är väldigt krävande på ett fåtal, eller en kärna. Kommer de med en sådan teknik vore det mycket trevligt enligt mig, men inget vi har hört om än, va? Bara spekulation från min sida.

Visa signatur

[1700X] [B350 mITX] [32GB DDR4@3000MHz CL15] [Vega 56] [Nano S] [D15S] [Win 10 Pro]

Permalänk
Medlem
Skrivet av Enigma:

X=XFR, annars är det frekvenser/cache/kärnor som skiljer.

Skrivet av HenKenny:

Hur vet "vi" att X står för XFR? Jag har inte sett något läckt om det än iaf? Gissning?

Skrivet av GarfieldPower:

This.

X ska väl stå för binnade dvs handplockade och utan medföljande kylare. Tror knappast AMD väljer att gimpa de billigare modellerna på det sättet.

Det verkar vara så att X står för XFR.

Det innebär nog att Ryzen 7 1700 inte boostar utöver sin max automatiskt, men att den går att clocka.

"*Extended Frequency Range avalible on select AMD Ryzen Processors"
http://imgur.com/9WGDdyr

Visa signatur

[1700X] [B350 mITX] [32GB DDR4@3000MHz CL15] [Vega 56] [Nano S] [D15S] [Win 10 Pro]

Permalänk
Medlem
Skrivet av Oegat:

Har de inte tidigare gått ut med att det blir endast 16 PCIe-lanes som processorn kontrollerar? Hoppas jag fattat detta fel, då vi snart kan nå ett scenario där 16 lanes är snålt.

Jag undrar för övrigt också hur varje CCX förhåller sig till de två minneskanalerna och olika PCIe-lanes, tex om det är så att ett CCX hanterar en minneskanal eller om minneskontrollern sitter på nästa nivå. Motsv. fråga för PCIe. Är det någon som har en kvalificerad gissning här?

Minneskontrollerna (då det är två minneskanaler) är separat från CCX, däremot så verkar dom ligga närma var CCX. Samma gäller PCI-E som är helt separat från CCX.

Ett tidigt Ryzen substarat från första sidan:

Det med att 16 PCI-E lanes skulle vara snålt stämmer inte även om första tanken lätt blir så.
Först så är Ryzen ett SOC som även har S-ATA m.m. direkt på processorn = inga PCI-E lanes förbrukas för det som redan finns.

Enklast att peka på ett svar jag gav i en annan tråd om just PCI-E och dess nytjande/skalande med grafikkort: #16609741

Två bilder från test där 4 st PCI-E lanes ger bättre grafikprestanda än 8 st eller 16 st PCI-E lanes, nu är dessa lite extrema och inte helt rättvisande då 8 st förefaller vara mest optimalt.
Skulle det sen vara någon som vill köra med 3 st eller 4 st grafikkort så kommer det säkert något kort med PLX (PCI-E extender), något som ändå brukar vara den vanliga lösningen på extremkort = med 3 eller 4 grafikkort så har man råd att betala det lite extra.
99% av användarna kör ändå inte med mer än 1 eller två grafikkort.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Visa signatur

| ASUS ROG Crosshari VIII Dark Hero | AMD Ryzen 5950X | Noctua D15 Chromax | G.Skill TridentZ Royal Gold 32GB DDR4 @ 3600Mhz CL14 | PowerColor Radeon RX 9070 XT 16GB Reaper | 2x WD SN850 1TB @RAID 0 + 2x Samsung 860 EVO 1TB @RAID 0 | Corsair HX 1000W | Corsair Obsidian 1000D | LG 34GN850 |

Monitor Audio Platinum PL100 II + Marantz Cinema 60
Klipsch R-115SW
Sennheiser HD650

Permalänk
Medlem
Skrivet av Bengt-Arne:

Minneskontrollerna (då det är två minneskanaler) är separat från CCX, däremot så verkar dom ligga närma var CCX. Samma gäller PCI-E som är helt separat från CCX.

Ett tidigt Ryzen substarat från första sidan:
http://www.3dnews.ru/assets/external/illustrations/2016/08/19/938056/855-4.jpg

Ok tack, jag såg bilden, men förstår först nu att channel = controller (då jag inser att det annars vore mycket kisel för jag vet inte riktigt vad). Så det är två controllers som sitter fysiskt nära varje CCX, undrar om de sitter logiskt lika nära eller om vi snackar NUMA redan vid två kanaler? Min föreställning har tidigare varit att ett NUMA-system har en minneskontroller per NUMA-node och därmed 2-4 minneskanaler per kontroller (för nyare Opteron/Xeon), men jag kan vara ute och cykla här.

Varifrån PCI-e kontrolleras (utöver de extra som sitter på sydbryggan) framgår inte av fotot för mig.

Skrivet av Bengt-Arne:

Det med att 16 PCI-E lanes skulle vara snålt stämmer inte även om första tanken lätt blir så.
Först så är Ryzen ett SOC som även har S-ATA m.m. direkt på processorn = inga PCI-E lanes förbrukas för det som redan finns.

Enklast att peka på ett svar jag gav i en annan tråd om just PCI-E och dess nytjande/skalande med grafikkort: #16609741
https://tpucdn.com/reviews/AMD/HD_5870_PCI-Express_Scaling/images/quake4_1920_1200.gif
https://tpucdn.com/reviews/AMD/HD_5870_PCI-Express_Scaling/images/darkathena_1280_1024.gif

Två bilder från test där 4 st PCI-E lanes ger bättre grafikprestanda än 8 st eller 16 st PCI-E lanes, nu är dessa lite extrema och inte helt rättvisande då 8 st förefaller vara mest optimalt.
Skulle det sen vara någon som vill köra med 3 st eller 4 st grafikkort så kommer det säkert något kort med PLX (PCI-E extender), något som ändå brukar vara den vanliga lösningen på extremkort = med 3 eller 4 grafikkort så har man råd att betala det lite extra.
99% av användarna kör ändå inte med mer än 1 eller två grafikkort.

Jag känner till detta och att även ett gtx1080 presterar likvärdigt i spannet x4-x16 (förutsatt PCI-e 3.0). Men jag tänker ändå att om sockeln ska hålla så länge så kan det ändå uppstå scenarier i framtiden då antal lanes till GPUer blir det första att flaska. Men det kanske är ett orealistiskt scenario även på 5-7 års horisont. Det är i vilket fall inte en oro som kommer att hindra mig från att köpa om Ryzen blir det vi i övrigt väntar oss.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Permalänk
Avstängd

det ser bra ut för AMD, verkar vara enormt strömeffektiv och ha prestanda inpå skylake.

Tror intel kommer ha sämre tider framför sig, men de har grävt sin egen grav efter sandy bridge.
de har helatiden utgåt ifrån att AMD aldrig skulle komma ifatt och nu står Zen och kollar ner på dem.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.