Rykte: AMD kan ta 12 kärnor till sockel AM4 med arkitekturen Zen 2

2018-05-28 18:13

Permalänk

inquam

Medlem ★

Plats: Karlskrona
Registrerad: Aug 2009

●

Skrivet av SweMerlin:

Färre kärnor men högre frekvens och IPC på dem, det är vad jag personligen vill ha och vad jag finner intressant.

.

Gå till inlägget

Eller fler kärnor och intelligens att gå upp i höga klockfrekvenser när få kärnor pressas hårt.

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Rapportera Redigera

Citera flera Citera

2018-05-28 18:16

Permalänk

mkk

Medlem ★

Registrerad: Jul 2001

●

Inte heller TSMC's 7nm lär antagligen ge utrymme till några stora frekvenshöjningar, men är bara processen så bra som den redan verkar så kan det helt klart finnas möjlighet till fler kärnor. Sedan kanske det likväl dröjer till Zen 2+ beroende på kanske redan spikade lanseringsscheman.

Skickades från m.sweclockers.com

Rapportera Redigera

Citera flera Citera

2018-05-28 18:16

Permalänk

inquam

Medlem ★

Plats: Karlskrona
Registrerad: Aug 2009

●

Skrivet av Ozzed:

Kanske. Men då får det förmodligen bli någon form av "golden sample" då de flesta 2700X idag blir rätt så varma, och ska de behålla arkitekturen som den är så får de i så fall göra avsteg från 102W TDP, vilket kommer göra att vissa billiga moderkort inte kommer stödja den då VRM på dem helt enkelt är för klena.

Gå till inlägget

Med den lilla kylare man får med och hur bra den klarar kyla skulle jag säga att 2700X klarar sig väldogt bra fär att ha 8 kärnor. Intel som redan gått rätt varma med 6 kärnor får det nog svettigt med 8 kärnor om de inte börjar löda IHS'en nu. Sedan slipper de undan lite genom att inte skicka med en kylare (som hade visat hur varm den går) utan kräver av kunden att köpa en "tillräckligt bra" kylare själv.

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Rapportera Redigera

Citera flera Citera

2018-05-28 18:19

Permalänk

SwedenVirre

Medlem

Plats: Ängelholm
Registrerad: Jul 2009

●

@inquam: Intressant? Så ThreadRippers "SMP" configuration påverkar inte spel något nämnvärt med stutters osv? Nu var det ett tagsedan jag körde ett SMP system men jag hade ganska mycket problem när en cpun behövde låna ram från den andra processorn.

Visserligen var detta på ett Socket Fr2 system med Barcelona cpuer(2347HE)

hade visserligen 16GB ram per processor till en början, men ju fler stickor som dog ju värre blev mina problem i just spel.

Så efter det har jag bara kört singel socket system(x58, x79 och x99)

har nämligen gått i tankarna när laptopen inte behövs längre att bygga en stationär igen men är lite allergisk när spel inte flyter, man blir lite sur och stänger av och är butter ett tag

Visa signatur

12900K, 48GB DDR5, GTX Titan Xp 12GB

Sugen på att köra e-GPU?

Rapportera Redigera

Citera flera Citera

2018-05-28 18:23

Permalänk

SweMerlin

Medlem ★

Plats: Stockholm
Registrerad: Mar 2011

●

Skrivet av inquam:

Eller fler kärnor och intelligens att gå upp i höga klockfrekvenser när få kärnor pressas hårt.

Gå till inlägget

Ja, att helt sonika stänga av de som inte används (behövs) och så trycka upp de som används. Det är ett bra alternativ

.

Visa signatur

AMD Thunderbird 1.33 GHz (133 MHz Bus), Epox 8K7A, 1 x 256MB Corsair PC2100 DDR SDRAM, 20.5GB 7200 RPM Western Digital EIDE, Visiontek GeForce 3

Rapportera Redigera

Citera flera Citera

2018-05-28 18:27

Permalänk

inquam

Medlem ★

Plats: Karlskrona
Registrerad: Aug 2009

●

Skrivet av SwedenVirre:

@inquam: Intressant? Så ThreadRippers "SMP" configuration påverkar inte spel något nämnvärt med stutters osv? Nu var det ett tagsedan jag körde ett SMP system men jag hade ganska mycket problem när en cpun behövde låna ram från den andra processorn.

Visserligen var detta på ett Socket Fr2 system med Barcelona cpuer(2347HE)

hade visserligen 16GB ram per processor till en början, men ju fler stickor som dog ju värre blev mina problem i just spel.

Så efter det har jag bara kört singel socket system(x58, x79 och x99)

har nämligen gått i tankarna när laptopen inte behövs längre att bygga en stationär igen men är lite allergisk när spel inte flyter, man blir lite sur och stänger av och är butter ett tag

Gå till inlägget

Nu har jag 32 GB med fyra stickor. Men har aldrig upplevt några issues. Jag förväntade mig faktislt mer "småstrul" än vad jag upplevt. Tänkte man skulle behöva mellan deras olika minnesmodeller, avaktivera kärnor oxh annat hela tiden men förutom just FarCry 3 och 4 så har all spel fungerat utan issues.

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Rapportera Redigera

Citera flera Citera

2018-05-28 18:58

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av SweMerlin:

Tyvärr gör det ju det. Det är svårare att skruva upp frekvensen på fler än på färre kärnor.

.

Gå till inlägget

Arkitekturen som sådan får inte lägre IPC eller lägre praktiska frekvenser för att du väljer att använda den till att designa en modell med många kärnor. Du klockar inte en 4-kärnig Ryzen högre än en 8-kärnig. Även vid 8 kärnor så är det själva arkitekturen och tillverkningsprocessen som sätter stopp.

Senast redigerat 2018-05-28 23:02

Rapportera Redigera

Citera flera Citera

2018-05-28 22:00

Permalänk

ChaosClocker

Medlem ★

Registrerad: Jul 2005

●

Fler kärnor ger utvecklare större möjligheter så även om idag inte tar nytta av mer än 4-8~ så när det släpps en 12 kärning mainstream cpu så kommer utvecklare ha program/spel ute ca 2 år efter o det kommer bli fler. Någon måste ta första klivet och självklart är det hårdvaran som skall ta klivet först och så är ofta fallet?

Visa signatur

PG279Q | 6XX | X-Fi Titanium HD | RTX 2080 | 5800X3D
G.Skill 3200 CL14 | B450-F | 970 EVO | Seasonic 750W | Fractal R5

Rapportera Redigera

Citera flera Citera

2018-05-28 22:41

Permalänk

lord_vasagos

Avstängd

Plats: falun
Registrerad: Apr 2002

●

Skrivet av jeffan97:

https://i.imgur.com/aLtukFN.jpg

Gå till inlägget

haha..nu har jag wallpaper så måste köpa en amd som matchar med då

Visa signatur

i3 6100 - MSI b150m pro-vd - 8gb 2133 ddr4 - GTX 950 GAMING 2G - z400s 120gb ssd - 1tb WD blue - Corsair 500w

Rapportera Redigera

Citera flera Citera

2018-05-28 22:57

Permalänk

igelkotte

Medlem ★

Plats: Umeå
Registrerad: Jun 2009

●

Dom som tycker det är fel med fler kärnor borde tänka på att nya produkter kommer för att någon ska utveckla program och spel för dom också, hade alla suttit med enbart 1 kärna i cpun hade ingen heller brytt sig om att programmera för fler och då hade en dual core idag varit helt värdelös. Om en utvecklare gör en sak så hakar kanske fler på också.

Visa signatur

Intel Pentium 2 MMX 233 @263 MHz, 192 mb, Nvidia TNT 16mb, 40gb hdd

Rapportera Redigera

Citera flera Citera

2018-05-29 01:03

Permalänk

biew

Medlem

Plats: i de norrlänska skogarna
Registrerad: Dec 2006

●

Jag är mest fundersam över hur AMD kommer att klämma in fler kärnor, blir det genom att ändra på CCX-klustret från nuvarande 4 till 6 kärnor eller genom att klämma in ett till kluster på samma kisel. Om jag förstått saken rätt så är en av de största problemen idag att skyffla data från punkt A till B så effektivt som möjligt, att då öka mängden banor nödvändiga i ett CCX-kluster för att få in fler kärnor låter i mina öron konstigt. Det baserar jag på att mängden banor mellan kärnorna bör öka i kvadrat om de är direkt sammankopplade i kluster, så kluster blir då inte 50% av endast 2 till kärnor, utan det blir >100%större för att de extra mängden banor som behövs mellan delad cache och liknande. Det skulle även effektivt döda all form av prestandaförbättring mellan zen och zen+ genom längre ledningsbanor och större latens mellan de olika bitarna i klustret.

En långt mycket enklare och mer elegant lösning bör vara att klämma in ett till kluster av kärnor på samma kisel, men vad vet jag

Visa signatur

räserdator+

Rapportera Redigera

Citera flera Citera

2018-05-29 01:39

Permalänk

SweMerlin

Medlem ★

Plats: Stockholm
Registrerad: Mar 2011

●

Skrivet av Aleshi:

Arkitekturen som sådan får inte lägre IPC eller lägre praktiska frekvenser för att du väljer att använda den till att designa en modell med många kärnor. Du klockar inte en 4-kärnig Ryzen högre än en 8-kärnig. Även vid 8 kärnor så är det själva arkitekturen och tillverkningsprocessen som sätter stopp.

Gå till inlägget

Inte AMD kanske. Jag inbillar mig att Intel hade klarat högre frekvenser om de stannat på fyra kärnor och arbetat på högre frekvenser på dem, istället för att lockas tillverka fler kärnor (vilket många av oss inte behöver ändå)

.

Visa signatur

AMD Thunderbird 1.33 GHz (133 MHz Bus), Epox 8K7A, 1 x 256MB Corsair PC2100 DDR SDRAM, 20.5GB 7200 RPM Western Digital EIDE, Visiontek GeForce 3

Rapportera Redigera

Citera flera Citera

2018-05-29 08:46

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av SweMerlin:

Inte AMD kanske. Jag inbillar mig att Intel hade klarat högre frekvenser om de stannat på fyra kärnor och arbetat på högre frekvenser på dem, istället för att lockas tillverka fler kärnor (vilket många av oss inte behöver ändå)

.

Gå till inlägget

Ja intels processorer klarar ju högre frekvens i grund, så där kan de ju inte få samma antal kärnor i maxfrekvens utan att överskrida TDP. Men eftersom AMDs kärnor ändå inte klarar de ~5GHz som Intels klarar så finns det inte samma trade off med att gå upp till 8 kärnor eller mer.

Rapportera Redigera

Citera flera Citera

2018-05-29 09:53

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av biew:

Jag är mest fundersam över hur AMD kommer att klämma in fler kärnor, blir det genom att ändra på CCX-klustret från nuvarande 4 till 6 kärnor eller genom att klämma in ett till kluster på samma kisel. Om jag förstått saken rätt så är en av de största problemen idag att skyffla data från punkt A till B så effektivt som möjligt, att då öka mängden banor nödvändiga i ett CCX-kluster för att få in fler kärnor låter i mina öron konstigt. Det baserar jag på att mängden banor mellan kärnorna bör öka i kvadrat om de är direkt sammankopplade i kluster, så kluster blir då inte 50% av endast 2 till kärnor, utan det blir >100%större för att de extra mängden banor som behövs mellan delad cache och liknande. Det skulle även effektivt döda all form av prestandaförbättring mellan zen och zen+ genom längre ledningsbanor och större latens mellan de olika bitarna i klustret.

En långt mycket enklare och mer elegant lösning bör vara att klämma in ett till kluster av kärnor på samma kisel, men vad vet jag

Gå till inlägget

Vi lär få se hur fundamentalt dagens fyra kärnors CCX är i Zen. Är tekniskt relativt enkelt och därför hyfsat sannolikt att man utnyttjar möjligheten till en högre transistorbudget till ett tredje CCX.

Fördelar med ett tredje CCX

tekniskt enkelt, ett till CCX blir bara en till nod på den interna bussen (som kör protokollet "Infinity fabric")
egentligen ingen annan transistorkostnad utöver den för CCX
varje CCX, vilket inkluderar L3$, är en funktionell enhet som kan "power-gate:as" i lägen där man vill få ner effekt

Nackdelar

asymmetri, flera körningar av samma multitrådade program kommer leda till olika prestanda beroende på hur trådarna fördelar sig över CCX. I praktiken ett långt mindre problem mellan CCX jämfört med hur det uppför sig på ThreadRipper och Epyc när det även kan sprida sig mellan CPU-kretsar (där blir även I/O-kapacitet och latens mot RAM asymmetriskt vilket inte alls är fallet för Ryzen med en CPU-krets)
effektiva storleken på L3$ ökar egentligen inte, varje CCX kan bara använda de 8 MB som är "lokalt"

Fördelar med att öka antalet kärnor i varje CCX

ger bäst prestandautdelning
om L3$ ökas proportionellt drar även program som använder en delmängd av kärnorna nytt av detta, Zen har visat sig vara mer beroende av sin cache jämfört med Core. D.v.s. har man ett "working-set" som inte får plats i cache tappar Zen mer prestanda jämfört med Core i de flesta fall, så en större L3$ är positivt för Zen

Nackdelar

den gigantiska nackdelen är att CPU-kärnorna och L3$ inom ett CCX är ihopkopplade med en cross-bar switch, komplexiteten sett till antal transistorer hos en sådan ökar exponentiellt med antalet noder. Så en ökning från fyra till sex kärnor ökar komplexiteten med en faktor fyra!

Skrivet av Aleshi:

Ja intels processorer klarar ju högre frekvens i grund, så där kan de ju inte få samma antal kärnor i maxfrekvens utan att överskrida TDP. Men eftersom AMDs kärnor ändå inte klarar de ~5GHz som Intels klarar så finns det inte samma trade off med att gå upp till 8 kärnor eller mer.

Gå till inlägget

i7-8700K har ju högre maxfrekvens jämfört med i7-7700K. i9-7940X (14 kärnor) har samma maxfrekvens som i7-7820X (8 kärnor). En specifik kärna kan nå 4,5 GHz (Turbo boost 3) och "normala" TB2 frekvekvensen är 4,3 för båda.

De har även samma frekvens när 8 kärnor jobbar på 4,0 GHz. (i9-7940X klarar 4,0 GHz till 12 kärnor).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (1)

2018-05-29 12:44

Permalänk

Gnarf

Medlem

Plats: Austrått, Norge
Registrerad: Sep 2005

●

@dlq84: 15 år i Norge lämanr sina spår i skrift och tal. Sorry

Visa signatur

Fractal Design Define R6, ASUS X99a, Xeon E5-2697v3@3.5Ghz allcore, 64gb Hynix ECC REG 2133Mhz, ASUS 1070GTX, 2.5gb nic

Server: Proxmox med OMV 5 och annat virtuellt: Supermicro X9SRH-7F, 64gb RAM, Xeon 2651v2, 4x10tb, 2.5gb Nic

Rapportera Redigera

Citera flera Citera

2018-05-29 14:06

Permalänk

Paddanx

Medlem ★

Plats: Malmö
Registrerad: Maj 2014

●

Skrivet av anon159643:

De som behöver fler kärnor så är Threadripper en bättre plattform. Sedan 16 kärnor är inte mycket att hänga i granen det heller, men ge oss då stöd för dubbla cpu på ett moderkort. -Det är väldigt sällan på konsumentnivå att en enda instans av en applikation behöver mer än 16 core och 32 trådar, kör man fler program eller instanser, ja då kan man sprida lasten på flera cpuer.

Gå till inlägget

Lite detta är dock poängen idag. Ta en titt i ditt aktivitetsfält, eller i resurshanteraren och räkna de 100+ saker som på ett eller annat sätt körs idag. Om något är våra datorer fullsmockade med program och saker som körs samtidigt idag vs bara 5-10 år sedan. Tror du måste gå till Windows 2000 bara för att ens komma under 50 processer idag.

Lägg till mängden bakgrundsjobb som görs både i Windows och andra saker. Webbläsare som öppnar 4+ core hantering med nästan varje flik fördelar på CPUerna. Det är inte så svårt att använda många trådar som folk verkar tro.

Svåra är så klart att använda dem 100%, men... måste du?
Jag ser det som om du envisas med att maxa din CPU hela tiden, är det lite dumt. Det är säkert kanon i beräkningssituationer, men titta på tex GPUer. Deras turbo och kylning idag beror enormt på att du spelar och har lite "marginal" för att undvika FPS dipps. Och om du kör benchmark kommer kortet bli varmt och klocka ner.

Detta kan man ironiskt också se på tex 2 st 1060 GPUer. MSI vs ASUS vem är snabbast?
På pappret, ASUS, för den har högre klock.... i verkligheten MSI kortet då dens kylning är bra nog att kunna låta den nå sin turbo, utan så hög spänning mycket mer ofta. Så ASUS kortet spenderar sin tid varmare och långsammare pga de satt högre spänning, för att klara den nivån.

Samma är det ju med dagens CPUer. Ta AMDs 2000 serie och AFR. Där har du en dynamisk anpassning efter behov. Så om du har 12 kärnor, men bara behöver 4, får du en boostad frekvens. Om du kör 8 får du en annan nivå, och kör du alla 12 får du den nivån. Mao... de anpassar sig efter dina behov, precis som en GPU gör.

Så snälla sluta titta på CPUer och GPUer som något stelt från 1990 talet nu, och titta på hur de fungerar idag. Om detta innebär att vi kan köpa 8c16t billigare, är det en Win för oss, även om det är "trasiga" CCX kluster. Trasig innebär nämligen inte nödvändigtvis sämre frekvens.

Skrivet av Nautilus011:

Det här så kallade "kärnornas krig", känns för mig lite som krystad andning. Inte heller ger det gemene man så mycket upplevd förbättring. Vad jag har uppfattat är det inte bara att trycka på en "knapp" så vips sprids lasten ut på alla kärnor. Tidigare va det Ghz-race där det va en tydligare upplevd förbättring från att gå från 1Ghz - 2Ghz. Men fysikens lagar sätter käppar i hjulen för ytterligare öka klockhastighet. Ju fler kärnor dom vill plocka in, ju mer tycks dom få kämpa med att inte behöva sänka klockfrekvens eller att bibehålla föregående generations klockfrekvens.

Dom vill sälja processorer, men har egentligen inte så mycket nytt att komma med, i alla fall inte för gemene man.
För mig som mest spelar (ingen streaming), är det väl mest optimalt att köra 4c/8t i 4.7Ghz än 6c/12t i 4.2Ghz.

Gå till inlägget

Skrivet av SweMerlin:

Inte AMD kanske. Jag inbillar mig att Intel hade klarat högre frekvenser om de stannat på fyra kärnor och arbetat på högre frekvenser på dem, istället för att lockas tillverka fler kärnor (vilket många av oss inte behöver ändå)

Gå till inlägget

Fysikens lagar har träffat Intel som en tegelvägg också... det kan du se i deras 10nm nod som skulle komma 2017... och nu kanske kommer 2019. Problemet är... Intel har förfinat 14nm med 14nm++ så mycket, att ingen 10nm gen 1 har en chans i helvete att nå de nivåerna.

Låt oss påminna er om vad 14nm 1 gen gör...
Broadwell.
Yep... de där 65W, 3.1-3.7Ghz CPUerna, som många inte ens når frekvenserna AMDs nya 2600X når stock. Och AMD har trots allt hoppat till 12nm på denna, med bara ny nod som tanke.

Skylake var lite hitNmiss, där du kunde få upp många av dem till ca 4,5Ghz (sweclockers fick sina i 4,4 och 4,6). Detta är efter Intel hade pillat med nod och så. Skulle därför säga att AMD är inte så långt efter som alla tror.

Och 10nm har de endast lyckats släppa någon 2-2,5Ghz laptop CPU sak... mao, de kan inte ens tillverka 3-4Ghz CPUer på denna nod än. Mao... Intel kommer vara fast på 14nm ett tag nu skulle jag tro, för även om de får liv i 10nm, lär det inte vara något som ens kan matcha 8700k, utan vi pratar en försämring... troligen tom en enorm sådan.

Skrivet av Aleshi:

Ja intels processorer klarar ju högre frekvens i grund, så där kan de ju inte få samma antal kärnor i maxfrekvens utan att överskrida TDP. Men eftersom AMDs kärnor ändå inte klarar de ~5GHz som Intels klarar så finns det inte samma trade off med att gå upp till 8 kärnor eller mer.

Gå till inlägget

Enda gången Intel vinner är om du:
1. Vill delidda din CPU och klocka 5Ghz+
2. Vill betala premium pris för något du troligen inte har nytta av (då folk tror 1060 får samma boost som 1080Ti)
3. Spelar något udda spel som än kör 1-2 kärnor där intels turbo kan pressa upp.

Säger inte att AMD är bästa CPUn... det ä den inte. Men det är utan tvekan en satans prisvärd sådan, och den har en design som möjliggör enorma förbättringar på sikt, där Intels redan är slipad... och inte längre kan slipas mycket mer.

Rapportera Redigera

Citera flera Citera (2)

2018-05-29 20:18

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Paddanx:

Enda gången Intel vinner är om du:
1. Vill delidda din CPU och klocka 5Ghz+
2. Vill betala premium pris för något du troligen inte har nytta av (då folk tror 1060 får samma boost som 1080Ti)
3. Spelar något udda spel som än kör 1-2 kärnor där intels turbo kan pressa upp.

Säger inte att AMD är bästa CPUn... det ä den inte. Men det är utan tvekan en satans prisvärd sådan, och den har en design som möjliggör enorma förbättringar på sikt, där Intels redan är slipad... och inte längre kan slipas mycket mer.

Gå till inlägget

Inget snack om att Ryzen är riktigt bra, framförallt för oss som kör Linux! Dels har Linux lägret alltid gillat AMD, men framförallt är UNIX-filosofin än mycket bättre match för Zen (och även SKL-X) jämfört med Windows-filosofin (där passar S-serien bättre). Går bl.a. att studera i Windows vs Linux resultaten i Geekbench 4, upp till 4C/8T får man i princip samma resultat oavsett OS men vid fler kärnor börjar framförallt Zen och SKL-X resultaten rejält tilta i favör för Linux!

Men finns några fall som kanske är lite bredare än de du listar där Intel utan tvekan har ledartröjan

alla former av I/O-begränsade laster, detta med väldigt stor sannolikhet orsaken till varför det går så extremt trögt för Epyc, servers tenderar göra en hel del I/O... Ingen skillnad vid bulköverföring, men är en klar skillnad när IOPS drar iväg
de som jobbar med problem i Matlab, Matematica, R och liknande program, här har man sedan lång tid tillbaka varit extremt duktigt på att utnyttja SSE/AVX/AVX512 (är upp till 3x bättre prestanda för Intel per kärna och MHz i SIMD)
CPUer för mobila enheter, här måste AMD lyfta sig rejält då första generationens Ryzen bara är någorlunda prestandamässigt konkurrenskraftigt mot Intels 15 W TDP modeller när Ryzen har sin cTDP satt till 25 W (CPU-mässigt, de flesta kontorsråttor klarar sig mer än väl med Intel iGPU). De Ryzen-modeller som är lanserade kör alla 25 W cTDP, t.ex. HP Envy x360 (något som man inte varit speciellt transparenta med, det antogs att de körde 15 W TDP men det är 25 W, vilket bl.a. TechReport fått ur HP och man nämner 1h31m in i denna podcast)

Och angående SIMD händer det rätt mycket intressant inom C++ världen kring detta. Tekniken har egentligen funnits sedan första Pentium MMX, men har fram till 2017 års C++ standard egentligen inte funnits något standardiserat och portabelt sätt för oss programmerare att dra nytta av detta. Sett till rå beräkningskraft används ju faktiskt bara 20-30 % av en modern x86 CPU om man inte alls nyttjar SIMD, så finns rejält med potential här.

Portabelt = jag ska inte behöva ändra min kod för att köra den på en CPU utan säg AVX512 och inte ändra den bara för att CPUn är en ARM med NEON. Och ska finnas stöd på ett sätt som man kan förvänta sig finns på alla relevanta system programmet kan tänkas köra på.

Sedan C++17 kan i nästan alla standardalgoritmer (d.v.s. de i <algorithms>, <functional> samt <numeric>) dra nytta av SIMD om funktionen man ger till algoritmen är "SIMD-säker". Enda man som programmerare behöver göra i det läget är att "tagga" koden med std::execution::par_unseq (om det är något som bättre skalas över CPU-kärnor väljer man i stället std::execution::par).

Inget som magiskt kommer ge heltalsfaktorer i prestanda, men är fullt realistiskt att inom ~5 år förvänta sig en generell prestandaboost på dagens CPU-modeller på kanske 30 % enbart från detta (förutsätter naturligtvis att CPU är flaskhals i applikationen).

SIMD är mer restriktivt jämfört med uppgiftsparallellism (som bäst hanteras med flera kärnor). Dock har SIMD långt bättre energieffektivitet jämfört med flera kärnor samt runt tre tiopotenser lägre synkroniseringskostnad (~10 ns i stället för ~10 µs som är fallet för att sprida ut något över kärnor). D.v.s man man komma åt rätt många fall där det finns potentiell parallellism som idag inte kan utnyttjas med flera kärnor då vinsten äts upp av synkroniseringskostnaden.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (1)

2018-05-29 21:15

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Paddanx:

Enda gången Intel vinner är om du:
1. Vill delidda din CPU och klocka 5Ghz+
2. Vill betala premium pris för något du troligen inte har nytta av (då folk tror 1060 får samma boost som 1080Ti)
3. Spelar något udda spel som än kör 1-2 kärnor där intels turbo kan pressa upp.

Säger inte att AMD är bästa CPUn... det ä den inte. Men det är utan tvekan en satans prisvärd sådan, och den har en design som möjliggör enorma förbättringar på sikt, där Intels redan är slipad... och inte längre kan slipas mycket mer.

Gå till inlägget

Tror du missförstår vad vi pratar om. Jag menar bara på att AMD inte hade kunnat nå högre frekvenser än de redan har om de satsade på färre kärnor. Intel däremot når högre frekvenser och har större trade off på att öka antalet kärnor då det sänker deras frekvenser. Ditt svar är lite orelaterat.

Rapportera Redigera

Citera flera Citera

2018-05-29 23:42

Permalänk

Triton242

Medlem ★

Plats: På din skärm
Registrerad: Jul 2001