Intel "Alder Lake" tar hybriddesign och 10 nanometer till stationära datorer

Permalänk
Melding Plague

Intel "Alder Lake" tar hybriddesign och 10 nanometer till stationära datorer

Med Alder Lake introduceras äntligen 10 nanometer för stationära datorer. Det blir två nya arkitekturer i en ny hybriddesign.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

10 nm är väl inget att hurra över, när konkurrenten har ännu mindre sedan snart två år tillbaka?

Visa signatur

R5 5600X | RTX 3060 Ti | 3DMark
O2 + ODAC | DT 1990 Pro | ModMic Wireless
XB273U GX | S2417DG | 55CX
G Pro X Superlight | VA88M MX Red Silent | pfSense + Mullvad VPN | Mobiler

Permalänk
Medlem
Skrivet av Casper:

10 nm är väl inget att hurra över, när konkurrenten har ännu mindre sedan snart två år tillbaka?

Intel 10nm har liknande densitet som TSMC 7nm.

Permalänk
Medlem
Skrivet av Casper:

10 nm är väl inget att hurra över, när konkurrenten har ännu mindre sedan snart två år tillbaka?

Går inte att jämföra på det sättet

Visa signatur

AW3423DW QD-OLED - Ryzen 5800x - MSI Gaming Trio X 3090 - 64GB 3600@cl16 - Samsung 980 Pro 2TB/WD Black SN850 2TB

Permalänk
Medlem
Skrivet av Casper:

10 nm är väl inget att hurra över, när konkurrenten har ännu mindre sedan snart två år tillbaka?

Vad jag har sett så får intel in mer trasistorer på sin 10nm än vad konkurenterna får in på 7nm. Så detta med nm är inget att bry sig om. Man borde prata om transistorer på en viss yta istället.

Visa signatur

Ryzen 5800X ROG STRIX X570-f GAMING FlareX DDR43600 cl 14-14-14-34 EVGA FTW3 Ultra RTX 3090

Permalänk
Datavetare

Angående densitet så är denna rätt illustrativ. Den är inte helt färsk, TSMC 5 nm ligger på ~170 MTr/mm² medan Samsung 5 nm ligger på ~130 MTr/mm².

Också värt att notera att Samsungs 8 nm är baserad på deras 10 nm, det dock en "ny" process i det att man ökat transistordensiteten från 10 nm.

Intels 10 nm är något tätare än TSMC 7 nm, men man måste ha klart för sig att detta visa maximal densitet. I många delar av en krets använder man sig av lägre densitet, framförallt i högpresterande kretsar med hög TDP!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Skrivet av Yoshman:

Angående densitet så är denna rätt illustrativ. Den är inte helt färsk, TSMC 5 nm ligger på ~170 MTr/mm² medan Samsung 5 nm ligger på ~130 MTr/mm².

Också värt att notera att Samsungs 8 nm är baserad på deras 10 nm, det dock en "ny" process i det att man ökat transistordensiteten från 10 nm.
https://fuse.wikichip.org/wp-content/uploads/2019/06/tsmc-density-with-7nm.png

Intels 10 nm är något tätare än TSMC 7 nm, men man måste ha klart för sig att detta visa maximal densitet. I många delar av en krets använder man sig av lägre densitet, framförallt i högpresterande kretsar med hög TDP!

Hur kan Intels 14nm++ ha mindre densitet än deras 14nm?

Permalänk
Datavetare
Skrivet av Dinkefing:

Hur kan Intels 14nm++ ha mindre densitet än deras 14nm?

Ingen aning, har läst på andra ställen att Intel i praktiken minskat densiteten något i de senare Skylake-generationerna. Orsaken sägs vara att denna minskning spred ut de saker som genererade mest värme lite bättre, vilket i sin tur gav lite högre maxfrekvens.

I Samsungs fall ska man i stort sätt kunna köra samma design både på 10 nm och 8 nm. Intel kanske kört en liknande idé, fast optimerat för en annan parameter. Tanken för Intel kanske var: vi kör 10 nm för bärbara/servers och optimerar 14 nm helt för desktop (maximal prestanda, offra perf/W). Så Intels fall blev då en förändring av processen så råkar minska maximal densitet resultatet... Dock ren gissning!

Finns andra varianter. TSMC har två 7 nm processer, men då den ena bygger på EUV är det i praktiken en totalt separat process med sina egna unika designregler. Finns därför väldigt liten poäng att gå från den "vanliga" TSMC 7 nm till deras 7nm EUV för en existerade krets, i det läget är det vettigare att designa för 5 nm (som bara finns i EUV-smak).

Edit: fixade brainfart i tidigare text
Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Casper:

10 nm är väl inget att hurra över, när konkurrenten har ännu mindre sedan snart två år tillbaka?

Bara en med AMD i signaturen säger sånt. Ingen fara, ganska vanligt här.

Du får helt enkelt lära dig vad täthet är i diverse arkitekturer.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Permalänk
Inaktiv
Skrivet av marcusOCZ:

Bara en med AMD i signaturen säger sånt. Ingen fara, ganska vanligt här.

Trist attityd. Kan vi släppa sånt här istället för att klanka ner på varandra, snälla? Vi är alla teknikentusiaster, bättre att samlas kring det som förenar oss än att så splittring.

Permalänk
Medlem
Skrivet av Dinkefing:

Hur kan Intels 14nm++ ha mindre densitet än deras 14nm?

Skrivet av Yoshman:

Ingen aning, har läst på andra ställen att Intel i praktiken minskat densiteten något i de senare Skylake-generationerna. Orsaken sägs vara att denna minskning spred ut de saker som genererade mest värme lite bättre, vilket i sin tur gav lite högre maxfrekvens.

Verkar inte bara vara ett designval i kretsdesignen, noden i sig verkar ha lägre densitet.

"A third improved process, "14nm++", is set to begin in late 2017 and will further allow for +23-24% higher drive current for 52% less power vs the original 14nm process. The 14nm++ process also appear to have slightly relaxed poly pitch of 84 nm (from 70 nm)."

https://en.wikichip.org/wiki/14_nm_lithography_process

Blev lite sugen att kolla på hur Samsungs 8nm står sig mot TSMC 7nm i praktiken när det kommer till densitet för GPUer (extremt grovt uppskatat):

GV100 på 12nm TSMC som har en rätt lik design mot GA100 på TSMC 7nm, ligger på 25.9M/mm² mot 65.6M/mm². TU102 som likt GV100 tillverkas på 12nm på ligger på 24.7M/mm² (dvs, RTX delen gör att kretsen har ca 5% lägre densitet). Så tar man hänsyn till dom 5% för GA102 som ligger på 45.1M/mm² på Samsungs 8nm och ställer mot GA100 så är TSMC 7nm runt 35% tätare.

Något som också påvisar hur stor skillnad kretsdesignen påverkar densiteten är att Apple A12 ligger närmare 90M/mm² på TSMCs 7nm nod!

Permalänk
Datavetare
Skrivet av sKRUVARN:

Verkar inte bara vara ett designval i kretsdesignen, noden i sig verkar ha lägre densitet.

"A third improved process, "14nm++", is set to begin in late 2017 and will further allow for +23-24% higher drive current for 52% less power vs the original 14nm process. The 14nm++ process also appear to have slightly relaxed poly pitch of 84 nm (from 70 nm)."

https://en.wikichip.org/wiki/14_nm_lithography_process

Blev lite sugen att kolla på hur Samsungs 8nm står sig mot TSMC 7nm i praktiken när det kommer till densitet för GPUer (extremt grovt uppskatat):

GV100 på 12nm TSMC som har en rätt lik design mot GA100 på TSMC 7nm, ligger på 25.9M/mm² mot 65.6M/mm². TU102 som likt GV100 tillverkas på 12nm på ligger på 24.7M/mm² (dvs, RTX delen gör att kretsen har ca 5% lägre densitet). Så tar man till hänsyn till dom 5% för GA102 som ligger på 45.1M/mm² på Samsungs 8nm och ställer mot GA100 så är TSMC 7nm runt 35% tätare.

Något som också påvisar hur stor skillnad kretsdesignen påverkar densiteten är att Apple A12 ligger närmare 90M/mm² på TSMCs 7nm nod.

Tack för info! Ändring verkar ju bl.a. rikta sig till möjliggöra högre frekvenser, detta gör det möjligt att switcha transistorn snabbare: "+23-24% higher drive current".

Maximal densitet på en process verkar vara allt mindre kritisk för de kretsar som designas för riktig hög frekvens, både Intel och AMD har nämnt att vi kanske får räkna med lite lägre maxfrekvenser på kommande noder.

De som primärt kunnat utnyttja hög densitet är GPUer och framförallt systemkretsarna för mobiler. Då mobilkretsarna designas för <10 W blir ju inte effekt per mm^2 ett problem (i alla fall inte än), högre densitet för dem betyder att man kan stoppa in fler funktioner på de runt 100 mm^2 som man verkar hålla sig till på dessa kretsar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Är hybrid-processorer likt sabeltandade tigrar?
Spännande och utdöda då konceptet inte höll i verkligheten?

Jag ser hybrider som summan av det sämsta från de båda lägren:
* För få kärnor för att mäta sig mot konkurrensen i prestandasegmentet
* För strömtörstiga för att kunna konkurrera i energieffektivitet
Och jag misstänker vi kan lägga till:
* För dyra, man får mycket mer för pengarna om man går "all in" på en av de två

Permalänk
Datavetare
Skrivet av ThomasLidstrom:

Är hybrid-processorer likt sabeltandade tigrar?
Spännande och utdöda då konceptet inte höll i verkligheten?

Jag ser hybrider som summan av det sämsta från de båda lägren:
* För få kärnor för att mäta sig mot konkurrensen i prestandasegmentet
* För strömtörstiga för att kunna konkurrera i energieffektivitet
Och jag misstänker vi kan lägga till:
* För dyra, man får mycket mer för pengarna om man går "all in" på en av de två

Hur är det utdött? Alla Apples egendesignade kretsar använder konceptet, samma gäller alla high-end Snapdragon och Exynos.

Rätt använt får man det bästa av två världar. Om man bara har "stora" kärnor begränsas man på två sätt. Dels i hur många kärnor som går att stoppa in på en viss kretsyta, dels hur högt man kan klocka "all-core". Enda sättet att hantera detta är att bygga enklare kretsar som då offrar prestanda per kärna.

Det är ingen hemlighet att maximal all-core prestanda uppnås mest effektivt genom att ha många lite enklare/lägre klockade kärnor. Problemet är att en sådan design är kass för interaktiva laster.

Maximal absolut prestanda per kärna uppnås bäst genom högsta möjliga produkt mellan frekvens och IPC, problemet där är att varje enskild kärna drar massor med effekt och tar massor med transistorer.

Orsaken att big.little konceptet är vettigt är därför att väldigt mycket hamnar i en av två klasser. Interaktiva laster, dessa skalar normalt väldigt dåligt med CPU-kärnor och vill ha maximal prestanda per kärna. "Batch-jobb" som kör under längre tid i bakgrunden och många av dessa skalar bra eller mycket bra med CPU-kärnor, här är prestanda per kärna mindre viktigt utan man vill optimera total beräkningskraft (extremfallet här är GPUer, de har extremt många kärnor som var och en är rejält långsam).

Det svåra är primärt att hitta balansen mellan antalet stora och antalet små kärnor, vad som är optimalt beror vad man primärt optimerar för. För telefoner och bärbara räcker det i de flesta fall med 1-2 stora kärnor, nytt för just lanserade Snapdragon (tror Exynos kör samma stuk) är en väldigt snabb kärna (den hanterar det du som använder direkt interagerar med), ett par snabba kärnor (beräkningskraft för interaktiva laster) samt ett gäng energieffektiva kärnor (för bakgrundsjobb och för att maximera total kraft för batch-jobb).

8 stora kärnor i Alder Lake S handlar nog primärt om att ha tillräckligt med stora kärnor för att hantera t.ex. spel och andra saker som inte skalar nära perfekt med kärnor men ändå skalar bättre än det mesta. Tar man bort spel ur ekvationen räcker <=4 stora kärnor väldigt långt.

Ryktet säger ju 40-50 % högre IPC i Golden Cove jämfört med Skylake. Om det stämmer kan vi utgå från att en Golden Cove kärna är stor, även på Intel 10 nm. Gracemont är ju inte speciellt "liten", IPC för den förväntas ligga på Skylake-nivå fast med maxfrekvensen kommer nog ligga på 3,0-3,5 GHz.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Hur är det utdött? Alla Apples egendesignade kretsar använder konceptet, samma gäller alla high-end Snapdragon och Exynos.

Rätt använt får man det bästa av två världar. Om man bara har "stora" kärnor begränsas man på två sätt. Dels i hur många kärnor som går att stoppa in på en viss kretsyta, dels hur högt man kan klocka "all-core". Enda sättet att hantera detta är att bygga enklare kretsar som då offrar prestanda per kärna.

Det är ingen hemlighet att maximal all-core prestanda uppnås mest effektivt genom att ha många lite enklare/lägre klockade kärnor. Problemet är att en sådan design är kass för interaktiva laster.

Maximal absolut prestanda per kärna uppnås bäst genom högsta möjliga produkt mellan frekvens och IPC, problemet där är att varje enskild kärna drar massor med effekt och tar massor med transistorer.

Orsaken att big.little konceptet är vettigt är därför att väldigt mycket hamnar i en av två klasser. Interaktiva laster, dessa skalar normalt väldigt dåligt med CPU-kärnor och vill ha maximal prestanda per kärna. "Batch-jobb" som kör under längre tid i bakgrunden och många av dessa skalar bra eller mycket bra med CPU-kärnor, här är prestanda per kärna mindre viktigt utan man vill optimera total beräkningskraft (extremfallet här är GPUer, de har extremt många kärnor som var och en är rejält långsam).

Det svåra är primärt att hitta balansen mellan antalet stora och antalet små kärnor, vad som är optimalt beror vad man primärt optimerar för. För telefoner och bärbara räcker det i de flesta fall med 1-2 stora kärnor, nytt för just lanserade Snapdragon (tror Exynos kör samma stuk) är en väldigt snabb kärna (den hanterar det du som använder direkt interagerar med), ett par snabba kärnor (beräkningskraft för interaktiva laster) samt ett gäng energieffektiva kärnor (för bakgrundsjobb och för att maximera total kraft för batch-jobb).

8 stora kärnor i Alder Lake S handlar nog primärt om att ha tillräckligt med stora kärnor för att hantera t.ex. spel och andra saker som inte skalar nära perfekt med kärnor men ändå skalar bättre än det mesta. Tar man bort spel ur ekvationen räcker <=4 stora kärnor väldigt långt.

Ryktet säger ju 40-50 % högre IPC i Golden Cove jämfört med Skylake. Om det stämmer kan vi utgå från att en Golden Cove kärna är stor, även på Intel 10 nm. Gracemont är ju inte speciellt "liten", IPC för den förväntas ligga på Skylake-nivå fast med maxfrekvensen kommer nog ligga på 3,0-3,5 GHz.

Stora problemet med intels variant är väl att de små och stora inte har samma instruktionsuppsättning (AVX-512 åtminstone) så det lär ju bli bökigt. Sen drar väl intels små kärnor mer än Apples stora, trots att apples stora presterar bättre än Intels stora redan nu...

Nej denna hybrid känns död innan ankomst för min del i alla fall