Intel ögnar RISC-V för framtidens superdatorer

Permalänk
Melding Plague

Intel ögnar RISC-V för framtidens superdatorer

När superdatorer ska öka prestandan med 100 000 procent till 2027 tittar Intel på RISC-V snarare än x86.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Intel: "Vi kan inte slå AMD i prestanda/pris/effekt på HPC med x86. RISC V låter nu intressant."

Permalänk
Medlem

Risc-v och andra effektiva arkitekturer låter trevligt, men frågan är om kisel är relevant när omställningen sker

Permalänk
Medlem

RISC-V har helt klart en ljus framtid. Tänk er konkurrensen som är möjligt med en öppen ISA.

Permalänk
Medlem
Skrivet av dlq84:

RISC-V har helt klart en ljus framtid. Tänk er konkurrensen som är möjligt med en öppen ISA.

Om den ska få ett brett användningsområde utanför HPC måste det få någon form av hårdvarutillverkare som är beredd att satsa på RISC-V och en stor mjukvarutillverkare som är berett att stöjda det. Mycket pengar involverat och en hel del risk. Men det räcker väl med att en aktör gör en brutalt effektiv lösning för relativt låg kostnad så kan det ändras. Vore inte dumt om RISC-V får fotfäste på t.ex. mobilmarknaden och sen datormarknaden.

Permalänk

Vendor lock-in är skit. Så jag hoppar mycket på detta öppna alternativet.

Permalänk
Medlem

"öka prestandan med 100 000 procent"
Börjar lukta Skynet.

Visa signatur

Ryzen 5800X3D | 64 GB Ram | 7900 XTX | Samsung 990 Pro 4 TB + Seagate FireCuda 520 2TB * 2
Laptop: Core 9 Ultra 185H | 24GB Ram | RTX 4060 | 3 TB NVME

Permalänk
Medlem
Skrivet av Lodisen:

"öka prestandan med 100 000 procent"
Börjar lukta Skynet.

Nänä, de ska köra Crysis i höga FPS och 1000FPS i CS för hela kontoret.

Permalänk
Medlem

100 000 procent....

undac_excited_meme.jpg

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Medlem
Skrivet av Fulci:

Om den ska få ett brett användningsområde utanför HPC måste det få någon form av hårdvarutillverkare som är beredd att satsa på RISC-V och en stor mjukvarutillverkare som är berett att stöjda det. Mycket pengar involverat och en hel del risk. Men det räcker väl med att en aktör gör en brutalt effektiv lösning för relativt låg kostnad så kan det ändras. Vore inte dumt om RISC-V får fotfäste på t.ex. mobilmarknaden och sen datormarknaden.

Ja, absolut. Vi ser redan RISC-V börja bli träda in i IoT-segmentet. Och nu HPC. Desktop är väl alltid trögast att ta sig in på eftersom det finns en så gigantisk mängd stängd källkod. Android skulle helt klart funka, utvecklar-pipelines finns ju redan "native" för Android-applikationer och arkitekturer (x86 och ARMv7, v8, v9). Att lägga till en till är ingen stor sak där.

Permalänk
Medlem

" ...vilket motsvarar beräkningskraften i drygt 25 miljoner Geforce RTX 3090 Ti exempelvis."

Undrar vad får den för hash-rate...(:

Permalänk
Medlem

Tänk om man hade kunnat få motsvarande prestanda ökning på Desktop.

Säg spel i

x86 Windows
1080p 60 FPS
4K 15 FPS
8K 4 FPS

VS

RISC-V Linux
1080p 60000 FPS
4K 15000 FPS
8K 4000 FPS

Jag hade hellre kört RISC-V och Linux.

(Ja jag är medveten om att sån prestandaskalning i spel med största sannolikhet inte hade fungerat)

Permalänk
Konsolpleb 🕹
Skrivet av Joppis:

100 000 procent....

undac_excited_meme.jpg

Satt med miniräknaren och trodde jag räknade fel först

Visa signatur

240p är livet

Permalänk

Om vi pratar om en ökning i storleksordningen 1000x så känns det inte relevant att gå över till procent...

Permalänk
Medlem

Hoppas AMD även har något i görningen de inte har annnonserat ut ännu. Framtiden börjar se ljus ut angående effektivare CPUer.

Visa signatur

www.fckdrm.com - DRM år 2024? Ha pyttsan.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Vendor lock-in är skit. Så jag hoppar mycket på detta.

Risc-V är open source dock, så fritt fram att göra din egen cpu

Permalänk
Skrivet av Lordsqueak:

Risc-V är open source dock, så fritt fram att göra din egen cpu

Jag la till texten "öppna alternativet" i mitt inlägg för att förtydliga.

Jag råkar på så mycket dåliga saker p.g.a. inlåsningar så jag vill bort från det. Där tillverkare tar extrema priser bara för att de kan och man inte har något alternativ. Inom CPU marknaden är det idag stenhård konkurrens och priserna pressade, men man vet aldrig vad som kan hända i framtiden.
*edit*
Excempel molnleverantör som tar 500kr/månaden exklusive moms för en RDP cal. Där en RDP cal för dem säkerligen kostar under 1000kr i inköp.

Permalänk
Skrivet av Ingetledigtnamn:

Om vi pratar om en ökning i storleksordningen 1000x så känns det inte relevant att gå över till procent...

Fast det låter ju coolare. 😎

Permalänk
Skrivet av Lordsqueak:

Risc-V är open source dock, så fritt fram att göra din egen cpu

Tror personen menade just det. Det i artikeln är bra därför att vendor lock-in är dåligt.

Permalänk
Medlem

Giganterna intel och amd kommer nog sätta risc v på kartan på riktigt när dom klämt ur det sista x86 har att ge.

Visa signatur

Ryzen 5900X @ Stock, MSI Suprim X 3080 @ game mode.

Permalänk
Avstängd

"En superdator av zettascale-klass utför en triljard flyttalsoperationer per sekund vilket motsvarar beräkningskraften i drygt 25 miljoner Geforce RTX 3090 Ti exempelvis."

För en jämförelse mellan valfri modern x86 istället för ett spelkort fungerar ju inte?

Permalänk
Medlem
Skrivet av BMac:

"En superdator av zettascale-klass utför en triljard flyttalsoperationer per sekund vilket motsvarar beräkningskraften i drygt 25 miljoner Geforce RTX 3090 Ti exempelvis."

För en jämförelse mellan valfri modern x86 istället för ett spelkort fungerar ju inte?

Flera av de kraftfullaste av dagens superdatorer får sin beräkningskraft från alla grafikkort de har i sig.

En grej med RISC-V är att det finns en officiell skalbar vektor-ISA som gör det möjligt att tillverka processorer som fungerar mer som hur ett grafikkort gör beräkningar men utan den hårda gränsen mellan vad som är CPU och vad som är GPU. Detta skulle göra det lättare att skriva HPC-program.

En liknande skalbar vektor-ISA finns också för ARM, och de första chippen med det (Fujitsu A64FX) tillverkades också speciellt för superdatorer.

Visa signatur

För övrigt anser jag att tobak ska förbjudas.

Permalänk
Medlem

Går snabbare framåt för Risc-V än jag hade förväntat mig men har svårt att tro Intel kommer hålla sig till någon helt öppen arkitektur eller ISA.

Tror vi kommer se plattforms-inlåsningar till någon del.

Visa signatur

Rota3: Ryzen 5600 - 32GB - Radeon RX 7600 - Kingston NV200 2TB - Fractal Design R3 - EVGA Supernova 750W

Permalänk
Datavetare

ARM är lite av en mess när det kommer till "vad är kompatibelt med vad...". ARMv7, v8, v9 refererar till ISA-specifikation och från ARMv8 finns två helt separata ISA med i specifikationen.

För OS är det primärt ISA-stöd som måste till, Android stödjer för närvarande både 32-bit ARM och ARM64. Allt fler high-end ARM CPUer har börjat droppa stöd för 32-bit ARM (Apple gjorde det tidigt, Cortex X2 saknar också 32-bitars stöd).

Ur den aspekten är RISC-V mer likt x86. Det 32-bit och 64-bit använder samma instruktionsuppsättning, OS-kärnor som stödjer 64-bit kan också hantera 32-bit applikationer.

Tyvärr är det inte bara en stor sak att lägga till bra stöd för en ISA, det är ett gigantiskt jobb!

Att få till grundläggande stöd i för en instruktionsuppsättning är i sammanhanget trivialt. RISC-V har sedan länge sådant stöd i kompilatorer samt standardbibliotek i C och C++ (som möjliggör enklare OS och IoT). RISC-V har också relativt moget stöd i Linux-kärnan.

För mer avancerade applikationer, som t.ex. de som används i HPC, krävs enorma investeringar för optimering av bibliotek och mer avancerade utvecklingsverktyg som kan utnyttja specialfinesser som vektorenheter. Rätt får företag som har något vidare track-record att lyckas på den delen, är egentligen bara Intel (x86 SIMD), Nvidia (CUDA) och Apple (Metal (GPU) och Accelerate(CPU-acceleratorer)) som har lyckats riktigt bra.

Ställer man x86 SIMD mot CUDA ser man att Intel har misslyckats rätt ordentligt på en punkt när det kommer till designen: varje gång man "breddar" SIMD (SSE->AVX->AVX-512) blir direkta vinsten i existerande programvara noll, medan program skrivna i CUDA i princip alltid ser en väldigt bra skalning till nya "bredare" designer utan att programmet ändras.

Upp till ARMv8 kallas SIMD stödet där för NEON (SVE är en valfri utökning till ARMv8), det har tyvärr samma fundamentala problem som AVX. Skillnaden här är att ARM verkar insett begränsningen och därför aldrig brytt sig om att bredda instruktionerna (NEON är fortfarande 128 bit även i ARMv9, SVE2 är skalbar från 128-bit till 2048 bit).

Det RISC-V har och ARM64 fått med ARMv9 är en SIMD design som kan skala existerande program likt hur Nvidia kan skala med CUDA. Så vad man i praktiken kan göra med dessa vektor-instruktioner är att bygga in en GPGPU-del i CPU som kan skalas på samma sätt som GPUer.

Fördelen med "integrerad GPGPU i CPU" för HPC är att vissa problem behöver har både skalära delar (hanteras bäst av CPU) och data-parallella delar (hanteras överlägset bäst med GPGPU), om dessa delar sker väldigt ofta blir latens mellan skalär-delen och vektor-delen kritisk, dGPU blir då en rejäl flaskhals p.g.a hög latens över PCIe (eller motsvarande).

Så här långt har inte RISC-Vs vektor-design visat att den fungerar även i praktiken. ARM har med sitt SVE (Scalable Vector Extension, deras "nya" SIMD design) genom Fugaku som var världens snabbaste superdator i två års tid (den har rätt nyligen blivit förpassad till plats 2).

Men givet att RISC-Vs vektor design konceptuellt är rätt likt SVE (som för övrigt förbättrades innan det integrerades i ARMv9, SVE2) pekar mycket på att det kommer bli bra. Intel har massor med bibliotek (framförallt OneAPI och specifikt MKL) och kompilatorer (för SIMD har de ISPC) som om de även fixar RISC-V stöd för snabbt kommer lyfta den ISAn till "riktigt bra för tunga beräkningar".

Skrivet av BMac:

"En superdator av zettascale-klass utför en triljard flyttalsoperationer per sekund vilket motsvarar beräkningskraften i drygt 25 miljoner Geforce RTX 3090 Ti exempelvis."

För en jämförelse mellan valfri modern x86 istället för ett spelkort fungerar ju inte?

För den typ av problem som är riktigt beräkningstunga börja CPUer bli lite passé (t.ex. vid presentationen av Ryzen 7000, hur är det relevant att man råkar vara tiotals procent snabbare än någon annan CPU i Blender när dagens GPUer är 10-30 gånger snabbare, avståndet lär öka än mer i höst med nästa GPU-generation).

Ett 3090Ti är typiskt tiotals gånger snabbare än 12900K/5950X inom dessa områden, så bara göra matten själv

Men som redan nämnts: jämförelsen mot GPU är i detta fall mer relevant då RISC-V och ARM64/SVE designmässigt mer lik en CPU med integrerad GPGPU del.

Skrivet av nick-li:

Går snabbare framåt för Risc-V än jag hade förväntat mig men har svårt att tro Intel kommer hålla sig till någon helt öppen arkitektur eller ISA.

Tror vi kommer se plattforms-inlåsningar till någon del.

RISC-V har en fri specifikation för själva instruktionsuppsättningen. Finns inga restriktioner på att mikroarkitekturen för kretsar som använder RISC-V ska vara öppen.

En farhåga som vissa lyft med RISC-V är att standarden har explicit stöd för "vendor specific extensions of ISA". Tror själv den farhågan är ogrundad, det är inte värre än vad vi idag sett hos x86 de senaste 20 åren. Finns en lång rad extensioner i x86 som accelererar specifika saker, de flesta extensioner finns i de senaste modellerna men är inte så att senare modeller alltid har alla extensioner från tidigare modeller (ovanpå det finns lite variationer mellan Intel och AMD).

Man får lösa det som på x86: några enstaka fall måste ha extensionerna, de fungerar då bara på specifika CPU-modeller. Majoriteten av alla fall kommer använda bibliotek som dynamiskt kollar vilka extensioner som finns och använda extensionerna när det finns en poäng.

ARM "löser" detta problem genom att i stort sätt förbjuda egna utökningar (finns dock ibland specifika utökningar från ARM som är valfria att lägga in, exempel är SVE i ARMv8, SVE2 är standard i ARMv9) från den version man licensierar (sedan ARMv7 är varje ny version ett strikt superset av versionen innan -> förenklar en hel del på programvarusidan).

Finns spekulation att Apple möjligt har ett undantag i form av någon matris-acceleration i M1/A13, men det verkar som det egentligen handlar om ett separat block som likt iGPU och NPUer är hjälpkretsar som råkar vara tight integrerad med CPU (så låg latens, effekten blir liknande den man skulle få genom att direkt utöka ISA).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Jag la till texten "öppna alternativet" i mitt inlägg för att förtydliga.

Jag råkar på så mycket dåliga saker p.g.a. inlåsningar så jag vill bort från det. Där tillverkare tar extrema priser bara för att de kan och man inte har något alternativ. Inom CPU marknaden är det idag stenhård konkurrens och priserna pressade, men man vet aldrig vad som kan hända i framtiden.
*edit*
Excempel molnleverantör som tar 500kr/månaden exklusive moms för en RDP cal. Där en RDP cal för dem säkerligen kostar under 1000kr i inköp.

Aha, Det var jag som missförstod vad du menade.

Permalänk
Medlem

Perfekt med en öppen arkitektur när tex Rysslands Elbrus inte levererar som den ska så räcker det bra att det tillhandahålls ett alternativ om blockaden av x86 från Intel och amd fortsätter. Likaså verkar Kina ha ett onormalt stort intresse jag förstår inte varför

Dock så måste några bra implementationer fram öppna eller ej för att det ska gå i lås.

Permalänk
Medlem
Skrivet av friArsenik:

" ...vilket motsvarar beräkningskraften i drygt 25 miljoner Geforce RTX 3090 Ti exempelvis."

Undrar vad får den för hash-rate...(:

Ja själva grejen är att all kryptering inklusive kryptovalutor blir föråldrade och värdelös.

Permalänk
Skrivet av cheesen:

Ja själva grejen är att all kryptering inklusive kryptovalutor blir föråldrade och värdelös.

Nu blir jag nyfiken. Vad får dig att dra den slutsatsen?

Det är ju inte så att en zettascale supercomputer kommer stå på var mans skrivbord. I runda tal säljs 10 miljoner grafikkort per kvartal. Huvuddelen är långt ifrån lika kraftfulla som ett 3090 Ti men några års produktion borde i alla fall komma i samma härad som 25M 3090 Ti. Så motsvarande beräkningskraft finns rimligen redan, flera gånger om, i dagsläget, men den används huvudsakligen till annat än mining. Är det det faktum att de kommer sitta i "samma" dator som gör att kryptovalutor blir föråldrade?

Permalänk
Medlem
Skrivet av Yoshman:

Fördelen med "integrerad GPGPU i CPU" för HPC är att vissa problem behöver har både skalära delar (hanteras bäst av CPU) och data-parallella delar (hanteras överlägset bäst med GPGPU), om dessa delar sker väldigt ofta blir latens mellan skalär-delen och vektor-delen kritisk, dGPU blir då en rejäl flaskhals p.g.a hög latens över PCIe (eller motsvarande).

Väldigt intressant ämne, inte minst för M1..

Någon som känner till några exempel på algoritmer, bibliotek eller applikationer som drar extra mycket nytta av att ha kort latens mellan skalär-delen och vektor-delen? T.ex. något problem som använder sig av matrisoperationer på data som är "lagom stort" för att både gammaldags SIMD på CPU och PCIe-latensen ska bli en flaskhals.

Permalänk
Quizmaster Malmö 22

Att det är öppet, betyder det att t.ex USA inte kan låsa ute vem de vill som de gjorde med Android?

Visa signatur

[Gigabyte EP35-DS4][Intel Core 2 Duo E8400 3.0 Ghz][2x2GB Corsair XMS 2][Gainward GTX 570][Sandisk Extreme II 480GB][Corsair HX 620W][Fractal Design Define XL R4][Acer GD245HQBID]