Intel "Alder Lake" träder fram ur skuggorna – upp till dubblerad flertrådsprestanda

Permalänk
Inaktiv
Skrivet av Yoshman:

I verkligheten är stödet för AVX-512 nog betydligt mer använt än de flesta skulle gissa, så vad är orsaken?

Mest vetenskapliga applikationer som använder AVX-512 i dagsläget, enligt andras redogörelser jag sett/wikipedia. Även bland proffsapplikationer så verkar det rätt skralt; inte ens Blender eller Photoshop stödjer det tydligen än vill jag minnas, och ännu skralare är det ju bland spel.

Tycker det känns som Intels supernishade strategi leder till rätt många skott i foten för dem måste jag säga.

Citat:

Om man tar bort kommentaren för "print" anropet skulle den variera beroende på om man kör SSE, AVX, AVX-512 eller NEON (Arms variant av SIMD). Faktum är att den kan variera även om man kör säg AVX, då en kompilator översätter detta till assembler öppnar sig en rad nya praktiska möjligheter till optimering. Logiken i koden behöver dock inte ändras alls, den kommer automatiskt att utnyttja de instruktioner man säger till kompilatorn är OK att använda!!

Ja det är ju schysst, men när AVX-512 är som du säger ett lapptäcke, exakt vilka instruktioner ska vi flagga som OK att använda? Om man inte har en JiT-kompilator som kan harva ut kod just för ens egen Intel-propp (där de gnidna cheferna förmodligen rullat tärning för att bestämma vilka instruktioner som ska ingå bara för att jävlas lite extra), så blir det ju ofta ett glapp mellan vad proppen kan erbjuda och vad mjukvaran kan utnyttja, för att den faktiskt ska kunna gå att köra på Intels B-lag till processorer där AVX-implementationen artificiellt strypts så man kan kräva både skjorta och underbyxor i pris på de dyraste processorerna...

Eller så får man förkompilera kod i femtielva variationer för de programslingor som använder AVX-512 och sedan dynamiskt kalla just den kod som ens egen propp har stöd för... Om man felciterar en viss (numera säkert mindre ihågkommen) Sundbybergare, så "många slingor bli're". Hur många slingor blir det då? Får räkna på det, tack och hej typ!

Så antingen går resurser outnyttjade, eller så blir det väldigt komplext och krångligt. Bara för att Intel ska krångla till allt med flit så jäkla mycket. Som jag sett det beskrivas så har ju AVX-512 till och med flaggor för individuella instruktioner, det är ju verkligen att göra extra besvär för alla involverade.

Permalänk
Datavetare
Skrivet av anon132576:

Mest vetenskapliga applikationer som använder AVX-512 i dagsläget, enligt andras redogörelser jag sett/wikipedia. Även bland proffsapplikationer så verkar det rätt skralt; inte ens Blender eller Photoshop stödjer det tydligen än vill jag minnas, och ännu skralare är det ju bland spel.

Tycker det känns som Intels supernishade strategi leder till rätt många skott i foten för dem måste jag säga.

Ja det är ju schysst, men när AVX-512 är som du säger ett lapptäcke, exakt vilka instruktioner ska vi flagga som OK att använda? Om man inte har en JiT-kompilator som kan harva ut kod just för ens egen Intel-propp (där de gnidna cheferna förmodligen rullat tärning för att bestämma vilka instruktioner som ska ingå bara för att jävlas lite extra), så blir det ju ofta ett glapp mellan vad proppen kan erbjuda och vad mjukvaran kan utnyttja, för att den faktiskt ska kunna gå att köra på Intels B-lag till processorer där AVX-implementationen artificiellt strypts så man kan kräva både skjorta och underbyxor i pris på de dyraste processorerna...

Eller så får man förkompilera kod i femtielva variationer för de programslingor som använder AVX-512 och sedan dynamiskt kalla just den kod som ens egen propp har stöd för... Om man felciterar en viss (numera säkert mindre ihågkommen) Sundbybergare, så "många slingor bli're". Hur många slingor blir det då? Får räkna på det, tack och hej typ!

Så antingen går resurser outnyttjade, eller så blir det väldigt komplext och krångligt. Bara för att Intel ska krångla till allt med flit så jäkla mycket. Som jag sett det beskrivas så har ju AVX-512 till och med flaggor för individuella instruktioner, det är ju verkligen att göra extra besvär för alla involverade.

Med OneAPI är exemplet jag gav en one-liner. Och då är det just JIT, förutom att OneAPI program använder den AVX-variant som din dator råkar ha är det också trivial att köra på GPU, CPU och/eller FPGA.

Tiderna ändras!

Edit: och angående vad som redan använder AVX-512, i de senaste versionerna av Blender finns ju Intels Open Image Denoiser och den använder inte bara AVX-512 utan även AVX-512 VNNI*. Mycket pekar på att AVX-matrisen blir är plottrigare när Alder Lake lanseras då Gracemont får stöd för AVX VNNI (d.v.s. samma instruktioner som för AVX-512 fast med 256 bitars bredd).

* Intel Open Image Denoise internally builds on top of Intel oneAPI Deep Neural Network Library (oneDNN), and automatically exploits modern instruction sets like Intel SSE4, AVX2, and AVX-512 to achieve high denoising performance. A CPU with support for at least SSE4.1 or Apple Silicon is required to run Intel Open Image Denoise.

Notera att Intel fattar att det inte räcker att slänga ut saker som "öppen källkod". För att saker ska få någon relevans krävs det dels att folk känner att det finns livskraft i projektet (Intel lägger massor med resurser på OneAPI) och lär nog ha svidit en del hos Intel, men de inser att man idag måste få med ARM64 på tåget (Intel Open Image Denoise stödjer det, likaså ISPC).

För spel vore det rent kontraproduktivt att använda AVX-512 då det skulle få CPUn att klocka ned sig. Spel är latenskritiska och har primärt ett beroende på skalär heltalsprestanda från CPU. Ens att använda AVX i spel kan man ställa lite frågetecken kring då spel primärt använder SIMD för 3D och homogena koordinater, d.v.s. 4x4 matriser och 4x1 vektorer. Givet att spel också använder 32-bitars flyttal blir 128-bitar en perfekt match i de flesta fall, SSE register kan hålla just 4 st 32-bitars flyttal (eller 4 st 32-bitars heltal) samtidigt som dagens CPUer inte alls klockar ned sig av SSE (men det kan de göra av AVX och definitivt av AVX-512).

Maskininlärning och vetenskapliga beräkningar med stora matriser är där AVX-512 skiner, av dessa är det maskininlärning som rimligen kommer ha någon relevans på "vanliga" datorer. Fast är just där iGPU kan bli riktigt användbar, även i system med dGPU. Rocket Lake S och Alder Lake S har kanske lite klen iGPU, men den kan i vissa lägen ändå dra jämt med ~8 kärnor som använder AVX

"The performance of Intel® ISPC for GEN was significantly improved in this release but still has room for improvements and we're working hard to make it better for the next release. Here are our results for mandelbrot which were obtained on Intel(R) Core(TM) i9-9900K CPU @ 3.60GHz with Intel(R) Gen9 HD Graphics (max compute units 24):
@time of CPU run: [16.343] milliseconds
@time of GPU run: [17.294] milliseconds
@time of serial run: [562] milliseconds"

iGPU i Rocket Lake S / Alder Lake S förväntas vara ~50 % snabbare än Gen9 med 24 EU.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Trollfabrik 🫶🏻
Skrivet av Drenmi:

Vid det här laget kanske det är dags att börja leka med idén att det är Intel själva som "läcker" all denna information. Varje gång jag besöker Sweclockers (typ en gång i veckan) är det nya rykten om processorer som kan tänkas anlända inom de kommande 3-4 åren.

Väldigt passande att Intel dominerar nyhetsflödet just precis då de faktiskt inte har någon dominerande produktuppsättning till salu. 🤔

Eller hur! Sammanträffanden, jag stöter också på dem varje dag.

Konspirationen är inte roligare än att Intel inom mycket kort lanserar en ny serie processorer med en ny arkitektur om en dryg vecka, samt att de redan till slutet av året släpper något än mer intressant. Självfallet dyker det upp nya uppgifter hela tiden då. Det där företaget med den där dominerande produktuppsättning lär ännu en gång få sin åktur i rykteskarusellen när något nytt närmar sig, ska du se.

Visa signatur

Kontaktas enklast via PM. Önskas svar i forumet citera mina inlägg eller pinga @Jacob. Finns även på Twitter.

"Science and technology have progressed to the point where what we build is only constrained by the limits of our own imaginations." – Justin R. Rattner

Permalänk
Medlem
Skrivet av Jacob:

Eller hur! Sammanträffanden, jag stöter också på dem varje dag.

Konspirationen är inte roligare än att Intel inom mycket kort lanserar en ny serie processorer med en ny arkitektur om en dryg vecka, samt att de redan till slutet av året släpper något än mer intressant. Självfallet dyker det upp nya uppgifter hela tiden då. Det där företaget med den där dominerande produktuppsättning lär ännu en gång få sin åktur i rykteskarusellen när något nytt närmar sig, ska du se.

Vad en enskild marknadsföringsavdelning på ett enskilt bolag sysslar med kan per definition inte klassas som "konspiration", men som retoriskt stilgrepp fungerar det ändock ofta ganska bra.

Jag tror du missförstod poängen. (Vilket är förståeligt då fanboy-grejen alltid vart en grej, och misstänker att du ser din beskärda del av det var dag.) Jag vill helst kliva av den sagda rykteskarusellen, och vem som sitter vid spakarna spelar då mindre roll.

Men jag förstår också att det är annorlunda nu för tiden, och folk törstar efter "nytt innehåll" i en utsträckning som jag inte gör, så jag kanske kort och gott får acceptera att jag blivit "surgubbe" som tyckte det var "bättre förr" och fixa ett eget filter. 😉