Intel "Raptor Lake" får upp till 24 kärnor och 32 trådar

Permalänk
Melding Plague

Intel "Raptor Lake" får upp till 24 kärnor och 32 trådar

Under sitt investerarmöte lyfter Intel på locket och demonstrerar en processor ur "Raptor Lake"-familjen.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Raptor lake...

Hatar att jag gillar det här namnet..

Visa signatur

Intel i7 10700KF (Noctua NH-D15) | Asus RADEON RX 7900 XTX TUF | 32 GB DDR4 HyperX Fury | Corsair RM1000X | Fractal Design R3 | Arch Linux, Win11

Permalänk
Medlem

Core 1200: 8+8
Core 1300: 8+16
Core 1400: 8+32

Undra om vi kommer behöva vänta ytterligare ett decennie för "Intel 5".

Visa signatur

| Corsair Crystal 460X | Z390-F | 9700K | ROG Ryujn 360mm | RTX 3080Ti | ROG Thor 850W | Vengeance Pro 3200mhz 16cl 16GB (2x8) | 970 Pro 2TB + 2xWD Black 4TB | ROG SWIFT PG279Q | Arctis 7 Pro Wireless | ROG Scope Deluxe red silent | ROG Chakram |

Permalänk
Medlem

Intressant om det är ny arkitektur igen för prestandakärnorna. Stämmer det kan det bli ännu svettigare än det redan blir för AMD med 7k-serien.

Permalänk
Medlem

"Up to double digit performance boost".

Yes. Så alltså 0-8% i spel och kanske 10% bättre prestanda i X benchmark.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

Det är inte det större antalet energieffektiva kärnor som ger den tvåsiffriga prestandaökningen?
Eller är det i enkeltrådad last också?

Permalänk
Medlem
Skrivet av wibbe44:

Intressant om det är ny arkitektur igen för prestandakärnorna. Stämmer det kan det bli ännu svettigare än det redan blir för AMD med 7k-serien.

Huh? Om prestandan inte blir två-siffrig i snitt (vilket Intel sagt istället för "Upp till") så kommer nog AMD inte ha några större problem med Raport-Lake. Att det är en ny arkitektur på kärnorna är i sig inte ett tecken på prestanda.

Skrivet av ronnylov:

Det är inte det större antalet energieffektiva kärnor som ger den tvåsiffriga prestandaökningen?
Eller är det i enkeltrådad last också?

Något säger mig att hade det varit någon större skillnad så hade de slagit på den stora trumman. Känns mer som Raptor-Lake satsar på fler kärnor mer än högre prestanda.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Xinpei:

Huh? Om prestandan inte blir två-siffrig i snitt (vilket Intel sagt istället för "Upp till") så kommer nog AMD inte ha några större problem med Raport-Lake. Att det är en ny arkitektur på kärnorna är i sig inte ett tecken på prestanda.

Något säger mig att hade det varit någon större skillnad så hade de slagit på den stora trumman. Känns mer som Raptor-Lake satsar på fler kärnor mer än högre prestanda.

Om inte Intel är helt ute och cyklar så innebär ny arkitektur för dem ganska givet mer prestanda. Senast Intel hade ny arkitektur som inte innebar mer prestanda måste varit Pentium 4-tiden?
AMD bör känna sig hotade med besked.

Permalänk

Svenssons users klarar sig fint på 8 bra och 16 energieffektiva kärnor. Det känns galet att bygga mainstreamplattormen för mer än så just nu. Det är såklart intressant om de gör någon Hedt lösning.

Man har alltid pratat om att folk behöver ha mer datakraft. Men för typ alla har det gått att man kör mer på molnet och därmed inte märker av detta. För vanliga folk så kör de webblösningar som ligger på andra servrar.

Jag skulle säga runt 16 core ligger sweatspotten för en nörd som labba lite hemma utan att köra något tyngre. Och hur man hanterar de energieffektiva kärnorna är en bra fråga. Hur kommer t.ex. sql server fungera på en VM som endast tilldelas 4st små energieffektiva kärnor?

Permalänk
Medlem
Skrivet av wibbe44:

Om inte Intel är helt ute och cyklar så innebär ny arkitektur för dem ganska givet mer prestanda. Senast Intel hade ny arkitektur som inte innebar mer prestanda måste varit Pentium 4-tiden?
AMD bör känna sig hotade med besked.

Säg det till Bulldozer kontra Phenom II. Bulldozer hade sämre IPC men högre flerkärnig prestanda under vissa laster.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

Slänger dom in lite arm kärnor så börjar det likna något.

Visa signatur

Ryzen 5900X @ Stock, MSI Suprim X 3080 @ game mode.

Permalänk
Medlem

Jag hoppas framförallt att Intel lyckas skruva ner energiförbrukningen jämfört med 12:e generationen. Jag hade uppenbarligen missuppfattat vilka kärnor det var som skulle komma att dubblas i antal, men även med dubbla antalet E-kärnor så måste Intel ha lyckats pressa ner förbrukningen totalt för att få plats med det i någon rimlig strömbudget.

Permalänk
Medlem
Skrivet av wibbe44:

Om inte Intel är helt ute och cyklar så innebär ny arkitektur för dem ganska givet mer prestanda. Senast Intel hade ny arkitektur som inte innebar mer prestanda måste varit Pentium 4-tiden?
AMD bör känna sig hotade med besked.

De säger ju själva "upp till" 10% bättre. Och detta är givetvis i labbmiljö på utvalda test. Så jag tror också det handlar om att bibehålla prestanda fast ha fler kärnor.

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Medlem
Skrivet av Sveklockarn:

Jag hoppas framförallt att Intel lyckas skruva ner energiförbrukningen jämfört med 12:e generationen. Jag hade uppenbarligen missuppfattat vilka kärnor det var som skulle komma att dubblas i antal, men även med dubbla antalet E-kärnor så måste Intel ha lyckats pressa ner förbrukningen totalt för att få plats med det i någon rimlig strömbudget.

Jag håller med att öka elförbrukning för mer prestanda hör inte hemma 2022

Permalänk
Medlem

Med 33% fler trådar behövs nog inte någon ny arkitektur för att ge upp till 10% högre prestanda om man väljer rätt scenarion.
Även om det bara är fler slöa kärnor borde det räcka flr att komma över 10%.
Edit: märkligt om intel, som är väldigt hårt pressade på aktiemarknaden inte skulle slå på stora trumman om en förbättrad arkitektur om chansen fanns.

Visa signatur

MB: Asus ROG Hero | CPU: i4770@4,6GHz | RAM: 16GB@1600 | GPU: 6970 | STORAGE: 2*120GB SSD | COOLING: Custom, Water

Permalänk
Medlem

Hm låter som cpu för laptop som dom har tagit till vanlig pc.
Om priset inte är lågt så bör AMD klara sig bra...
Men det blir svårare att jämföra cpu i mellan Intel & AMD.. Om man kollar i antal kärnor...

Visa signatur

Låda thermaltake view 91 M-kort ASUS X399 ROG Zenith Extreme CPU AMD Ryzen Threadripper 1920X 3.5 GHz Kylning Hemma byggd vattenkylning 2 x 480mm + 1 x 420mm radiatorer Minne 8 X 16Gb DDR4 HD SSD 240GB OCZ Trion 100 Grafik Gigabyte Geforce RTX 3080 10GB GAMING OC WATERFORCE WB AGG Corsair RM 1000w 80+ Gold Skärm ASUS 43" ROG Strix XG438QR 4K VA HDR 120 Hz

Permalänk
Medlem

Glad att Intel släpper en ny sval processor. Det är det bästa med Intel. Samt deras stockkylare.

Visa signatur

CPU: I7 7700k @ 4.6GHz - Noctua NH D15S - Asus ROG Strix Z270F Gaming.
GPU: RTX 3070TI @2 st 120mm cf-v12hp hydro dynamic fläktar. 👍
RAM: 32GB DDR4 3200MHz. HÅRDDISK: 4 st SSD, 2 Mekaniska.
MONITOR:1 Xiaomi MI 34"- 3440x1440 144Hz MONITOR:2 Optix MAG274R 27" 1080p 144Hz MONITOR/Tv:3 LG 47lv355n-ZB 47". Nätagg: Corsair Newton R2 1000W. Allt i ett Cooler Master CM Storm Stryker.

Permalänk
Medlem

Som gamer hade jag gärna sett en variant med 10+8 också.

Visa signatur

AMD Ryzen 9 5900x [Noctua NH-D15S chromax.black] | ASUS Crosshair VIII Dark Hero | 2x16GB G.SKILL Trident Z Neo [F4-3600C16D-32GTZN] | Gigabyte GeForce RTX 4090 24GB Gaming OC | ASUS PG279Q | ASUS Thor 850W | WD Black SN750 1TB | Fractal Design R4

Permalänk
Medlem
Skrivet av SpaceMan:

Med 33% fler trådar behövs nog inte någon ny arkitektur för att ge upp till 10% högre prestanda om man väljer rätt scenarion.
Även om det bara är fler slöa kärnor borde det räcka flr att komma över 10%.
Edit: märkligt om intel, som är väldigt hårt pressade på aktiemarknaden inte skulle slå på stora trumman om en förbättrad arkitektur om chansen fanns.

Jag tror att Intel blev fartblinda de 10 åren var ohotade med sitt QPI så de har inte haft en tanke eller anledning till att göra en ny arkitektur, det har handlat om småvariationer på nya prollar för att få lite mer.
Ska bli intressant att se när de slår i botten på hur små transistorer man kan göra, eller ska de börja klyva atomer?😂

Permalänk
Skrivet av Xinpei:

Säg det till Bulldozer kontra Phenom II. Bulldozer hade sämre IPC men högre flerkärnig prestanda under vissa laster.

Bulldozers kärnor var dock inga riktiga kärnor då kärnorna (två kärnor) delade på en fpu-unit istället för att varje kärna har varsin fpu-unit. Phenom I var också det en ingen rolig serie, Phenom II plåstrade såren lite men sen släppte Intel Sandy Bridge.

Permalänk
Datavetare
Skrivet av ronnylov:

Det är inte det större antalet energieffektiva kärnor som ger den tvåsiffriga prestandaökningen?
Eller är det i enkeltrådad last också?

Alltid vanskligt att lita för mycket på information från ES-kretsar samt vad program rapporterar kring HW-konfiguration på icke-lanserade kretsar.

Men givet att de läckor som funnits varit helt spot on på att 13900K kommer bli 8+16 kärnor finns det en sak man direkt kan säga: mängden L3$ kommer öka från 30 MB hos 12900K till 40 MB hos 13900K. L3$ i Core-serien är uppdelad i "slices", för Alder Lake är det en "slice" per "stor" kärna och en "slice" per 2 små kärnor. Storleken på varje "slice" är 2,5 MB i Golden Cove.

"Problemet" med större L3$ är att det har nära noll påverkan på prestanda hos de flesta applikation, men vissa spel är ett undantag för detta (kolla AMD, de nämner inget annat än spel när de pratar 5800X3D, antagligen för det mesta utanför spel kommer få en liten minskning i prestanda p.g.a. något lägre frekvens).

Det som också spekuleras kring är att efterföljaren till Golden Cove (sett flera som tror den kommer heta Raptor Cove) kommer öka storleken på L2$ från 1,25 MB till 2,0 MB per "stor" kärna. Ökning av L2$ kommer inte ge några gigantiska ökningar av IPC, men rent generellt är det fler fall som påverkas positivt ju lägre nivå cache man ökar storleken på.

Så om man ökar storleken på cache X % på en specifik nivå ger samma procentuella ökning större utslag om den görs på L1$ än L2$, ökning av L2$ ger större utslag än L3$.

Det har varit väldigt tyst om andra förändringar, så kan mycket väl vara så att "Raptor Cove" i praktiken är Golden Cove med större L2$. Realistiskt lär 60 % större L2$ kanske ge ~5 % högre IPC, lite mer i specifika fall (även här kan just spel se lite högre utväxling, å andra sidan är GPU-delen rätt ordentligt flaskhals för spel just nu).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Skrivet av talonmas:

De säger ju själva "upp till" 10% bättre. Och detta är givetvis i labbmiljö på utvalda test. Så jag tror också det handlar om att bibehålla prestanda fast ha fler kärnor.

Precis som med AMD så lär väl allt som gillar många trådar, gilla fler trådar även med Intel? Är ju specifika scenarion även med 5950X. Även om den klockar (single core) något högre, än lägre nummer i serien. Lär bli lika med Intel. Toppmodellen kommer klocka marginellt högre än den något billigare, med 8+8 eller 8+12 eller vad det blir. Men fortfarande specifika scenarion, där programmet måste älska trådar!

Annars är det väl Skylake V 2.0. Samma stora kärnor, samma små. Säkert 100-200 mhz högre klockade, och några kärnor till! Precis som vi är vana vid från Skylake

Permalänk
Medlem
Skrivet av Dinkefing:

Bulldozers kärnor var dock inga riktiga kärnor då kärnorna (två kärnor) delade på en fpu-unit istället för att varje kärna har varsin fpu-unit. Phenom I var också det en ingen rolig serie, Phenom II plåstrade såren lite men sen släppte Intel Sandy Bridge.

Korrekt. Diskussionen handlade dock om ny arkitekturer och att de skulle ge per automatik högre prestanda till vilket Bulldozer visade inte stämma.

Phenom I var, likt Intels första C2Q experiment i fyrkärniga processorer. De kostade mer och presterade ibland sämre än sin C2D/Athlon 64x2 motsvarighet. Framförallt på en marknad nästan alla programvaror var enkeltrådade. Tog år innan programvaran började använda fyra kärnor och fler trådar men då hade Intel släppt Sandy bridge redan.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Mithras:

Core 1200: 8+8
Core 1300: 8+16
Core 1400: 8+32

Undra om vi kommer behöva vänta ytterligare ett decennie för "Intel 5".

jag tror att de kommer få fart på det efter amd släpper saker på tsmc 6nm, som ju faktiskt är mindre än intel 10 nm, till skillnad från tsmc 7nm.

Visa signatur

i9 12900k, RTX3080, 3600MHz CL15 DDR4 , custom loop

Permalänk
Datavetare
Skrivet av Sveklockarn:

Jag hoppas framförallt att Intel lyckas skruva ner energiförbrukningen jämfört med 12:e generationen. Jag hade uppenbarligen missuppfattat vilka kärnor det var som skulle komma att dubblas i antal, men även med dubbla antalet E-kärnor så måste Intel ha lyckats pressa ner förbrukningen totalt för att få plats med det i någon rimlig strömbudget.

Finns det några bra mätningar kring hur mycket E-kärnorna drar?

Har inte fått tillgång till någon Alder Lake än, men rimligen är det liknande fördelning som hos Apples kärnor. Vid full last av alla kärnor (kompilering i mitt fall) där drar de 4 "små" kärnorna ~1 W medan de 4 "stora" kärnor drar ~15 W.

Går även att se IPC samt frekvenser, vilket gör att det går att räkna ut perf/W. De "små" kärnorna har en genomsnittlig IPC på ~1,4 medan de "stora" ligger på ~3,0 (d.v.s. de kör 3 instruktioner per cykel i genomsnitt på "riktiga fall", vilket är brutalt).

Frekvensen är 3,2 GHz på de "stora" kärnor och 2,1 GHz på de små.

De stora kärnorna har därför ~3.3 gånger högre absolut prestanda, men de små kärnorna har ~4,5 gånger högre perf/W.

Är just därför det är vettig med små+stora, även för desktop. Jagar man topprestanda i de flesta "vanliga" applikationer är 8 kärnor mer än tillräckligt, enda som spelar roll där är att öka prestanda per kärna. Jagar man all-core prestanda är det enda som spelar roll perf/W, för total effekt är huvudflaskhalsen.

Sedan finns ett problem på x86 som definitivt märks när jag ställer min 5950X mot M1: när man har saker i bakgrunden som använder alla kärnor får man en rad saker som påverkar prestanda på det man gör i bakgrunden negativt. Det är inte bara teoretiskt, vid 100 % last (kompilering) i bakgrunden laggar 5950X system rejält

  • alla högpresterande x86 CPUer har "turbo-boost", desktopmodeller med relativt många kärnor kan ha 20-25 % lägre frekvens, för bärbara kan det skilja >50 %

  • alla högpresterande x86 CPUer har SMT, när "andra" tråden är lastad minskar prestanda per CPU-tråd till ungefär 60-65 % av vad den annars är

  • ovanpå det ska alla CPU-trådar dela på vissa gemensamma resurser som RAM, I/O etc. Detta är nog ett hyfsat stor problem just för kompilering i bakgrunden, blir rätt ont om "plats" mot I/O och RAM för de fåtal CPU-trådar som kör programmet man har i förgrunden...

Alder Lake kan minska effekterna av de två första! Genom att hålla antalet "stora" kärnor på en "rimlig nivå" kan dessa hålla en högre frekvens när alla kärnor är aktiva. Vidare utnyttjar Alder Lake SMT som en sista utväg, först används de "stora" kärnorna, sedan lastas de små, sist tar man till SMT.

Inte lika bra som M1, den är så effektiv att SMT inte behövs + den saknar turbo så är samma frekvens oavsett last, men det är ett klart fall fram för att vara x86!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Känns bara som 12-serien med mer e-kärnor? Snark... skylake all over again? Snart är AMD förbi igen

Permalänk
Medlem

Jag är mest intresserad av vad de mer strömsnåla varianterna har och hur de presterar. Känns som de är mest intressanta. Högpresterande modellerna drar bara mer och mer känns det som.

Dock lär man få vänta på att få se hur det ligger till, inte ens Alder Lake har väl kommit med någon energieffektiv modell än?

Visa signatur

Chassi : BitFenix Prodigy Svart mITX Moderkort : Asus P8Z77-I DELUXE mITX CPU : Intel Core i7 3770K RAM : Crucial 16GB (2x8192MB) CL9 1600Mhz Ballistix Sport

Permalänk
Medlem
Skrivet av Yoshman:

Sedan finns ett problem på x86 som definitivt märks när jag ställer min 5950X mot M1: när man har saker i bakgrunden som använder alla kärnor får man en rad saker som påverkar prestanda på det man gör i bakgrunden negativt. Det är inte bara teoretiskt, vid 100 % last (kompilering) i bakgrunden laggar 5950X system rejält

  • alla högpresterande x86 CPUer har "turbo-boost", desktopmodeller med relativt många kärnor kan ha 20-25 % lägre frekvens, för bärbara kan det skilja >50 %

  • alla högpresterande x86 CPUer har SMT, när "andra" tråden är lastad minskar prestanda per CPU-tråd till ungefär 60-65 % av vad den annars är

  • ovanpå det ska alla CPU-trådar dela på vissa gemensamma resurser som RAM, I/O etc. Detta är nog ett hyfsat stor problem just för kompilering i bakgrunden, blir rätt ont om "plats" mot I/O och RAM för de fåtal CPU-trådar som kör programmet man har i förgrunden...

Inte lika bra som M1, den är så effektiv att SMT inte behövs + den saknar turbo så är samma frekvens oavsett last, men det är ett klart fall fram för att vara x86!

Därför det är så intressant att AMD visat intresse av att göra egen ARM-processor. Då kan de tävla friskt mot både Intel och Apple samtidigt! Men de har ju sagt att de har intresse om intresset finns. Så finns ju risk att det blir lite moment 22 över det hela. De gör ingenting för ingen visar intresse, men ingen visar intresse för de inte gör någonting? Får hoppas det sker samtal bakom "stängda dörrar" i frågan.

Permalänk
Skrivet av Yoshman:

Finns det några bra mätningar kring hur mycket E-kärnorna drar?

Har inte fått tillgång till någon Alder Lake än, men rimligen är det liknande fördelning som hos Apples kärnor. Vid full last av alla kärnor (kompilering i mitt fall) där drar de 4 "små" kärnorna ~1 W medan de 4 "stora" kärnor drar ~15 W.

Går även att se IPC samt frekvenser, vilket gör att det går att räkna ut perf/W. De "små" kärnorna har en genomsnittlig IPC på ~1,4 medan de "stora" ligger på ~3,0 (d.v.s. de kör 3 instruktioner per cykel i genomsnitt på "riktiga fall", vilket är brutalt).

Frekvensen är 3,2 GHz på de "stora" kärnor och 2,1 GHz på de små.

De stora kärnorna har därför ~3.3 gånger högre absolut prestanda, men de små kärnorna har ~4,5 gånger högre perf/W.

Är just därför det är vettig med små+stora, även för desktop. Jagar man topprestanda i de flesta "vanliga" applikationer är 8 kärnor mer än tillräckligt, enda som spelar roll där är att öka prestanda per kärna. Jagar man all-core prestanda är det enda som spelar roll perf/W, för total effekt är huvudflaskhalsen.

Sedan finns ett problem på x86 som definitivt märks när jag ställer min 5950X mot M1: när man har saker i bakgrunden som använder alla kärnor får man en rad saker som påverkar prestanda på det man gör i bakgrunden negativt. Det är inte bara teoretiskt, vid 100 % last (kompilering) i bakgrunden laggar 5950X system rejält

  • alla högpresterande x86 CPUer har "turbo-boost", desktopmodeller med relativt många kärnor kan ha 20-25 % lägre frekvens, för bärbara kan det skilja >50 %

  • alla högpresterande x86 CPUer har SMT, när "andra" tråden är lastad minskar prestanda per CPU-tråd till ungefär 60-65 % av vad den annars är

  • ovanpå det ska alla CPU-trådar dela på vissa gemensamma resurser som RAM, I/O etc. Detta är nog ett hyfsat stor problem just för kompilering i bakgrunden, blir rätt ont om "plats" mot I/O och RAM för de fåtal CPU-trådar som kör programmet man har i förgrunden...

Alder Lake kan minska effekterna av de två första! Genom att hålla antalet "stora" kärnor på en "rimlig nivå" kan dessa hålla en högre frekvens när alla kärnor är aktiva. Vidare utnyttjar Alder Lake SMT som en sista utväg, först används de "stora" kärnorna, sedan lastas de små, sist tar man till SMT.

Inte lika bra som M1, den är så effektiv att SMT inte behövs + den saknar turbo så är samma frekvens oavsett last, men det är ett klart fall fram för att vara x86!

Både Anandtech och Techpowerup har mätt e-kärnorna isolerat. Energiförbrukningen ser inte så bra ut- AMD leder klart!
Frågan är vilka program som går bättre med p-cores enbart?

Permalänk
Datavetare
Skrivet av Greyguy1948:

Både Anandtech och Techpowerup har mätt e-kärnorna isolerat. Energiförbrukningen ser inte så bra ut- AMD leder klart!
Frågan är vilka program som går bättre med p-cores enbart?

Tackar, kollade igenom dem. TechPowerUp testet lämnade kanske en del att önska, de måste ha gjort något fel och borde själva ha reagerat när deras perf/W mätning visar att 12900K i ”stock-clock” (så stora kärnorna ~5 GHz) skulle ha högre perf/W än både E-kärnorna men även P-kärnorna @3,9 GHz. De gör också alla perf/W jämförelse på väldigt flyttals-tunga program (se mer nedan om det).

Det är rätt svårt att isolera strömförbrukningen från specifika kärnor, om inte detta mäts på ett bra sätt och kan läsas ut (just detta är möjligt för M1) blir det inte riktigt en jämförelse mellan kärnor.

Föga oväntat gjorde AnandTech en riktigt bra analys! Dels konstateras en viktig sak att ha med sig när man tittar på benchmarks: E-kärnorna är inte speciellt bra på flyttals-tunga uppgifter, det ”by design” (sådana laster är i praktiken rätt ovanliga på desktop-system samtidigt som det krävs rätt mycket transistorer att optimera för detta fall).

Dels går man ju igenom att Intels ”Thread Director” bl.a. utför analys på hur olika program uppför sig, i alla fall under Windows 11 är schemaläggningen relativt komplex då vissa former av flyttals-tunga program får prio på P-cores (just p.g.a. att E-cores inte är speciellt effektiva på detta).

AnandTech skriver detta

”In the aggregate scores, an E-core is roughly 54-64% of a P-core, however this percentage can go as high as 65-73%. Given the die size differences between the two microarchitectures, and the fact that in multi-threaded scenarios the P-cores would normally have to clock down anyway because of power limits, it’s pretty evident how Intel’s setup with efficiency and density cores allows for much higher performance within a given die size and power envelope.”

Jämfört med M1 har Intel valt att pusha prestanda betydligt hårdare i sina E-kärnor, de presterar ungefär 60 % av en P-kärna, fast tar ~1/4 av kretsytan. Intel har helt enkelt valt en annan balans, man har inte lika mycket fokus på perf/W i sina E-kärnor, istället har man valt att gå mer på absolut prestanda.

AnandTech skriver att total ”package-power” (vilket är klart mer än bara kärnorna då det innefattar I/O, RAM-kontroller och L3$) är 35-40 W när alla 8 E-kärnor jobbar med det ligger på 110-125 W när alla 8 P-kärnor jobbar.

Kombinerar man prestandasiffrorna med effektsiffrorna hamnar man ändå på att E-kärnorna har minst 1,5 gånger högre perf/W jämfört med P-kärnorna (minst då man hamnar på det värdet genom att jämföra ”package-power”, men ökar man från t.ex. 8 till 16 E-kärnor är ju strömförbrukning i övriga delar i paketet i stort sätt konstant). Notera att det är mindre fördel i perf/W för flyttal än för heltal, det som rapporteras är genomsnitt över alla tester.

Här ligger Intels stora utmaning med Raptor Lake: AnandTech pekar på att kombinationen av 8 P-kärnor och 8 E-kärnor ger en mindre prestandavinst än man förvänta sig från deras prestanda var för sig. Finns flera förklaringar, men den stora är att i Alder Lake äter 8 P-kärnor upp i stort sätt upp hela effektbudgeten för paketet. Prestanda ökar ändå, det mycket då E-kärnorna ökar kretsens genomsnittliga perf/W.

Givet att Raptor Lake lär vara rätt lik Alder Lake kommer prestandalyftet att gå från 8+8 till 8+16 inte vara linjärt. Perf/W kommer gå upp i ”all-core” laster då andelen E-kärnor ökar, men förhoppningsvis kan man även skruva upp generella perf/W för annars äts ökande antalet kärnor rätt mycket upp av minskad frekvens…

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer