Intel Xe – arkitektur från bärbart till Exascale

Trädvy Permalänk
Number Six
Registrerad
Dec 1999

Intel Xe – arkitektur från bärbart till Exascale

En grafikarkitektur uppdelad i tre tydliga segment för olika ändamål. Intel avslöjar fler detaljer om kommande Xe.

Läs hela artikeln här

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa leder till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Okt 2008

Hmm... konsumentkorten beräknas dyka upp 2022... antar att det betyder två år till av skenande priser...

Skickades från m.sweclockers.com

I5 8600K, 16GB DDR4 @ 3000mHz, GTX 1080TI, 2TB SSD

Trädvy Permalänk
Medlem
Plats
Vid datorn
Registrerad
Feb 2007

@Hugashaka:
Fyra-fem, Intel kommer förmodligen följa samma gamla regel, tre generationer tills produkten är välslipad.

Trädvy Permalänk
Medlem
Plats
Finland
Registrerad
Jun 2004

Rambo cache? xD

Trädvy Permalänk
Medlem
Plats
Göteborg
Registrerad
Jul 2004
Skrivet av Hugashaka:

Hmm... konsumentkorten beräknas dyka upp 2022... antar att det betyder två år till av skenande priser...

Skickades från m.sweclockers.com

Förhoppningsvis släpper AMD något tillräckligt vasst för att nVidia ska behöva sänka sina priser denna gången istället för att höja dem.

AMD Ryzen 7 3800X | MSI X470 Gaming Pro Carbon | G.Skill 32GB 3600MHz CL16 Trident Z Neo C | MSI 2080Ti Gaming X Trio | BeQuiet! Dark Rock 4 Pro | EVGA Supernova G2 850W | Fractal Design Define S | Acer X34A | Corsair Strafe RGB MX Silent | Corsair Ironclaw RGB | HyperX Cloud II

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Okt 2008
Skrivet av str8forthakill:

@Hugashaka:
Fyra-fem, Intel kommer förmodligen följa samma gamla regel, tre generationer tills produkten är välslipad.

Det är nog ganska lugnt ändå. Kollar vi på hur intel har haft det så lär vi sitta på grafikkretsar i 7nm tills 2033...

Skickades från m.sweclockers.com

I5 8600K, 16GB DDR4 @ 3000mHz, GTX 1080TI, 2TB SSD

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Okt 2008
Skrivet av Mocka:

Förhoppningsvis släpper AMD något tillräckligt vasst för att nVidia ska behöva sänka sina priser denna gången istället för att höja dem.

Vi hade dom förhoppningarna när dom släppte navi. Resultatet blev istället att dom släppte kort med RTX 2060-prestanda utan strålspårning till samma peis som nVidia hade satt på tidigare nämnda modell.

Skickades från m.sweclockers.com

I5 8600K, 16GB DDR4 @ 3000mHz, GTX 1080TI, 2TB SSD

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011

Man leker inte med "game-cache", här drar man till med revansch direkt: Rambo cache...

Kisel i all ära, men det är egentligen sekundärt till en annan sak: programvara. Intel är uppenbarligen medveten om detta, man jobbar på något som går under namnet oneAPI.

"The oneAPI initiative Intel launched today will define programming for an increasingly AI-infused, multi-architecture world. oneAPI delivers a unified and open programming experience to developers on the architecture of their choice without compromising performance and eliminating the complexity of separate code bases, multiple-programming languages, and different tools and workflows. oneAPI preserves existing software investments with support for existing languages while delivering flexibility for developers to create versatile applications."

oneAPI slide-deck

Just nu finns egentligen bara ett realistiskt val för professionellt bruk: CUDA. Till om med AMD verkar för tillfället tycka att CUDA + deras HIP-projekt som man konvertera CUDA till något som man köras på GCN/RDNA är vad man primärt bör välja, OpenCL har man i praktiken gett upp.

Intel är ju de enda som verkar ha någon form av relevant satsning på OpenCL just nu. Vill kan köra något över lite fler enheter är man i praktiken fast på OpenCL 1.2. 2.x stödet är utanför Intels prylar rätt risigt och OpenCL SPIR-V stöd verkar vara helt Intel specifikt för tillfället. Men egentligen kvittar det, OpenCL är allt för komplicerat att använda jämfört med CUDA samtidigt som CUDA i praktiken är enklare att skriva saker som presterar väl i, så varför välja något annat?

För den som vill titta finns en beta att ladda ned, har inte haft tid att kolla själv.

Edit: var tvungen att snabb kolla i alla fall ett exempel i oneAPI. Verkar som det är SYCL som används som motsvarighet till CUDA på Nvidia GPUer.

Inte helt med på varför Khronos presterar SYCL som "C++ Single-source Heterogeneous Programming for OpenCL". Som jag förstått SYCL specifikationen så är det ju ett separata API. Det är dock designat så att man kan välja att implementera sitt SYCL ramverk ovanpå OpenCL (vilket är exakt hur Intel implementerar SYCL och deras tool-chain hittar man här). D.v.s. mer eller mindre använda OpenCL som "driver API" under huven.

AMD använder ju sitt HIP-projekt även för SYCL stöd, HipSYCL. HipSYSL har också stöd för SYCL med CUDA som "driver-lager" om man kör på Nvidia-kort.

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Plats
Märsta
Registrerad
Aug 2008

Det här är ju väldigt spännande och så, men det känns som det är väldigt mycket snack och i princip ingen verkstad överhuvudtaget hos Intel just nu.

Hur många framtida generationer av såväl CPUs som GPUs har vi hört om nu, och det enda som hänt är att de börjar smyga ut LP-chips på 10nm. Att i det läget gå ut och prata 7nm och faktiskt uttala sig om framtida lanseringsdatum - det känns inte seriöst. Att de skulle ha 7nm redo för masstillverkning under 2021, det har jag väldigt svårt att tro. Hoppas verkligen jag har fel, dock!

Fractal Meshify-C, Aorus Z370 Gaming 7, i7-8700K + be Quiet! Dark Rock Pro 4, 64GB G-Skill TridentZ 3600MHz, ASUS Strix RTX 2080 Ti OC, Samsung 960 Pro 1TB NVMe + 2x Samsung 850 EVO 2TB SSD

Trädvy Permalänk
Medlem
Registrerad
Jun 2015

Väldigt intressant artikel, tycker Intels satsning nu verkar oerhört mycket bättre än tidigare försök.
Sen om de piskar Nvidia återstår att se, Nvidia har ett enormt försprång och sitter en hel del patent som antingen tvingar Intel att tänka nytt eller använda äldre designer. Personligen hoppas jag att de har något nytt att tillföra som Nvidia inte tänkt på då kan vi få ett ordentligt priskrig.

Skickades från m.sweclockers.com

Trädvy Permalänk
Medlem
Registrerad
Feb 2019
Skrivet av Mocka:

Förhoppningsvis släpper AMD något tillräckligt vasst för att nVidia ska behöva sänka sina priser denna gången istället för att höja dem.

Har för mig att jag läste någonstans att 3000 serien skulle bli billigare en 2000 serien, men jag kan inte ta gift på detta

Skickades från m.sweclockers.com

Trädvy Permalänk
Medlem
Registrerad
Apr 2012

Jag minns när David Airlie la fram ett förslag att skapa en tillverkarneutral compute stack.
https://www.phoronix.com/scan.php?page=news_item&px=Red-Hat-P...
Sedan gick det nästan 1 månad innan Intel presenterade att de nu arbetar på oneAPI.
https://www.phoronix.com/scan.php?page=news_item&px=Intel-one...
https://www.servethehome.com/intel-one-api-to-rule-them-all-i...
https://www.tomshardware.com/reviews/intel-sunny-cove-gen11-x...
Jag tycker det var rätt beslut att satsa på oneAPI och jag förväntar mig att se liknande från AMD då även de har lagt grunden genom GPUopen och alla projekt de samlat därunder.

Jag funderade mest på kyllösningar när jag såg HPC varianten.

Trädvy Permalänk
Medlem
Registrerad
Nov 2013

Dejavu

Har hört detta förr... Hm... Var från någon Radja hos AMD...

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D

Trädvy Permalänk
Medlem
Plats
Sverige / Stockholm
Registrerad
Nov 2006
Skrivet av Yoshman:

Just nu finns egentligen bara ett realistiskt val för professionellt bruk: CUDA. Till om med AMD verkar för tillfället tycka att CUDA + deras HIP-projekt som man konvertera CUDA till något som man köras på GCN/RDNA är vad man primärt bör välja, OpenCL har man i praktiken gett upp.

Intel är ju de enda som verkar ha någon form av relevant satsning på OpenCL just nu. Vill kan köra något över lite fler enheter är man i praktiken fast på OpenCL 1.2. 2.x stödet är utanför Intels prylar rätt risigt och OpenCL SPIR-V stöd verkar vara helt Intel specifikt för tillfället. Men egentligen kvittar det, OpenCL är allt för komplicerat att använda jämfört med CUDA samtidigt som CUDA i praktiken är enklare att skriva saker som presterar väl i, så varför välja något annat?

Så OpenCL är kanske på väg att utfasas i förmån för CUDA?
Helt dött är det dock inte ännu. I jobbet, så sent som igår, stötte jag på patrull med en dator som just saknade OpenCL 1.2 HW-stöd, då denna skulle användas för CAM-beredning och programvaran för denna maskin, MasterCAM (fr.o.m. v2020), numera kräver detta om man vill uppnå fullgod funktion. MCAM Versionen släpptes alltså för ca 3-4v sedan och kräver numera OpenCL 1.2 ..men det är nog sannolikt att de nyare ramverken som du nämnde mycket riktigt aldrig kommer få någon större praktisk tillämpning om de är begränsade till Intel.

Dator: EEE901 N270/ 1GB / 20GB SSD ... Kraftigt nedbantat/tweakat Win7 x86 for speeeEED!
Facebook användare? Hatar tidslinjen? gå med i denna FB-grupp:
Undo Timeline ...med lite tur får h*lvetet ett slut!

Trädvy Permalänk
Medlem
Plats
Finland
Registrerad
Jul 2009

Hmm, skulle sitta fint med GPUs i socklar, då kunde man ha ett dotterkort till GPUn så behöver man inte kasta en 500-1000 kronors PCB när man byter. Men då krävs väl HBM så man inte måste byta sockel varje generation.

2700x @4,35Ghz,1,42 8C/8T (180W P95) (3,2 Ghz vardag @0,88V (30W P95)) || 16GB DDR4 @2933Mhz @11-12-12-24-35-210-1T || RX Vega 64 Strix @1,4Ghz Core, 0,9Ghz Mem @0,85V @150W (BFV)|| 1TB SSD (MX500) || Corsair HX1000 platinum || FD R6 TS vit (Noctua & Noiseblocker fläktar) || Crosshair Hero VII || Corsair H100i V2|| Silverstone SST-ARM22SC skärmstativ || Samsung 32" QHD 144 Hz VA + Asus 27" FHD 60 Hz IPS ||

Trädvy Permalänk
Medlem
Plats
Sundsvall
Registrerad
Okt 2003
Skrivet av Hugashaka:

Vi hade dom förhoppningarna [på prissänkningar] när dom släppte navi. Resultatet blev istället... samma peis som nVidia hade satt...

I alla fall ingen fortsatt prisökning!
... och inga ökningar är det mest realistiska att hoppas på i närtid.

Skrivet av osgorth:

... det enda som hänt är att de börjar smyga ut LP-chips på 10nm. Att i det läget gå ut och prata 7nm och faktiskt uttala sig om framtida lanseringsdatum - det känns inte seriöst. Att de skulle ha 7nm redo för masstillverkning under 2021, det har jag väldigt svårt att tro. Hoppas verkligen jag har fel, dock!

Kan mycket väl vara så att 7nm inte försenas mer än 10nm. Tittar man på hur planerna såg ut längre tillbaka så skulle ju 7nm vara i fullt produktionsläge nu, så en försening på ett par år fram till 2021 är inte orimligt.

För övrigt anser jag att MS FlightSim X borde vara standard som ett av benchmarkprogrammen.

Trädvy Permalänk
Medlem
Registrerad
Apr 2012
Skrivet av Yoshman:

Just nu finns egentligen bara ett realistiskt val för professionellt bruk: CUDA. Till om med AMD verkar för tillfället tycka att CUDA + deras HIP-projekt som man konvertera CUDA till något som man köras på GCN/RDNA är vad man primärt bör välja, OpenCL har man i praktiken gett upp.

Intel är ju de enda som verkar ha någon form av relevant satsning på OpenCL just nu. Vill kan köra något över lite fler enheter är man i praktiken fast på OpenCL 1.2. 2.x stödet är utanför Intels prylar rätt risigt och OpenCL SPIR-V stöd verkar vara helt Intel specifikt för tillfället. Men egentligen kvittar det, OpenCL är allt för komplicerat att använda jämfört med CUDA samtidigt som CUDA i praktiken är enklare att skriva saker som presterar väl i, så varför välja något annat?

För den som vill titta finns en beta att ladda ned, har inte haft tid att kolla själv.

Edit: var tvungen att snabb kolla i alla fall ett exempel i oneAPI. Verkar som det är SYCL som används som motsvarighet till CUDA på Nvidia GPUer.

Inte helt med på varför Khronos presterar SYCL som "C++ Single-source Heterogeneous Programming for OpenCL". Som jag förstått SYCL specifikationen så är det ju ett separata API. Det är dock designat så att man kan välja att implementera sitt SYCL ramverk ovanpå OpenCL (vilket är exakt hur Intel implementerar SYCL och deras tool-chain hittar man här). D.v.s. mer eller mindre använda OpenCL som "driver API" under huven.

AMD använder ju sitt HIP-projekt även för SYCL stöd, HipSYCL. HipSYSL har också stöd för SYCL med CUDA som "driver-lager" om man kör på Nvidia-kort.

ROCm, HIP osv. är något som är nödvändigt för AMD det används för att hjälpa till att migrera HPC system byggda med IBM/Nvidia/Intel till AMD hårdvara.
ROCm innehåller även OpenCL stöd så det är inget de gett upp men de måste även anpassa sig efter hur marknaden ser ut och vad befintliga system är uppbyggda av vilket kanske kan ses som enda realistiskt valet som du nämner.
Intel pratar om HPC och 1 exaflop aurora med 2st Intel Xeon+6st Ponte Veccio per node år 2021 så måste man även se att AMD HPC 2021 handlar framförallt om Frontier 1,5 exaflop med 1st Epyc + 4st Radeon instinct per node med infinity fabric.
För att det ska vara möjligt att migrera från HPC datorn "Summit" till "Frontier" så är HIP enormt viktig.
Mycket av det omfattande arbetet AMD utfört inom GPUopen med HIP och hela ROCm stacken med bland annat HSA (Heterogeneous System Architecture) har varit för att lägga grunden för att kunna ta sig in på HPC marknaden.
Utan detta arbete så hade Epyc och kommande Radeon Instinct (Arcturus ?) inte kunnat ta sig in på HPC marknaden så som de faktiskt lyckats göra.
Utan rätt mjukvara så spelar det ingen roll om man har den bästa hårdvaran och mjukvara har varit Intel och Nvidias styrkor, intressant att se det AMD så länge lagt grunden för klaffa så väl nu.
Olika marknader använder olika ramverk men ingen kan neka till att CUDA dominerar på flera områden.

Lägger till lite länkar om någon vill läsa mer om sånt jag nämner.
https://www.olcf.ornl.gov/wp-content/uploads/2019/05/frontier...
https://rocm.github.io/
https://gpuopen.com/rocm-do-you-speaka-my-language/
https://gpuopen.com/compute-product/hcc-heterogeneous-compute...
https://gpuopen.com/compute-product/hip-convert-cuda-to-porta...
https://www.intel.com/content/www/us/en/high-performance-comp...
https://www.amd.com/en/products/frontier
https://www.olcf.ornl.gov/frontier/

Trädvy Permalänk
Medlem
Registrerad
Jan 2011
Skrivet av hg:

Rambo cache? xD

Tänkte på det med.
Rambo dödar allt motstånd 😂

Skickades från m.sweclockers.com

MBP Retina 15" late 13 2,3ghz / 16gb ram / 512gb ssd / GT750m / Iphone 6 128gb / Timecapsule 3TB / Ipad Air 2 / Apple Watch 42mm

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av lastninja:

Så OpenCL är kanske på väg att utfasas i förmån för CUDA?
Helt dött är det dock inte ännu. I jobbet, så sent som igår, stötte jag på patrull med en dator som just saknade OpenCL 1.2 HW-stöd, då denna skulle användas för CAM-beredning och programvaran för denna maskin, MasterCAM (fr.o.m. v2020), numera kräver detta om man vill uppnå fullgod funktion. MCAM Versionen släpptes alltså för ca 3-4v sedan och kräver numera OpenCL 1.2 ..men det är nog sannolikt att de nyare ramverken som du nämnde mycket riktigt aldrig kommer få någon större praktisk tillämpning om de är begränsade till Intel.

Är just detta som är problemet, man är i praktiken fast på OpenCL 1.2 utanför Intels OpenCL implementation.

Detta är ett stort problem för moderna mer avancerade GPGPU-lösningar då stödet för att kunna använda pekare och behandla en minnesarea som direkt synligt både från CPU och GPU kräver minst OpenCL 2.0. Detta kallas unified memory (även i CUDA), Pascal och senare samt tror det är Vega och senare har HW-stöd för detta (Intel har ju alltid haft stöd för detta i sina iGPU, men från Broadwell eller om det är Skylake finns mer stöd för koherens så det än mer fungerar som mellan två CPU-kärnor).

Skrivet av Snubb1:

ROCm, HIP osv. är något som är nödvändigt för AMD det används för att hjälpa till att migrera HPC system byggda med IBM/Nvidia/Intel till AMD hårdvara.
ROCm innehåller även OpenCL stöd så det är inget de gett upp men de måste även anpassa sig efter hur marknaden ser ut och vad befintliga system är uppbyggda av vilket kanske kan ses som enda realistiskt valet som du nämner.
Intel pratar om HPC och 1 exaflop aurora med 2st Intel Xeon+6st Ponte Veccio per node år 2021 så måste man även se att AMD HPC 2021 handlar framförallt om Frontier 1,5 exaflop med 1st Epyc + 4st Radeon instinct per node med infinity fabric.
För att det ska vara möjligt att migrera från HPC datorn "Summit" till "Frontier" så är HIP enormt viktig.
Mycket av det omfattande arbetet AMD utfört inom GPUopen med HIP och hela ROCm stacken med bland annat HSA (Heterogeneous System Architecture) har varit för att lägga grunden för att kunna ta sig in på HPC marknaden.
Utan detta arbete så hade Epyc och kommande Radeon Instinct (Arcturus ?) inte kunnat ta sig in på HPC marknaden så som de faktiskt lyckats göra.
Utan rätt mjukvara så spelar det ingen roll om man har den bästa hårdvaran och mjukvara har varit Intel och Nvidias styrkor, intressant att se det AMD så länge lagt grunden för klaffa så väl nu.
Olika marknader använder olika ramverk men ingen kan neka till att CUDA dominerar på flera områden.

Lägger till lite länkar om någon vill läsa mer om sånt jag nämner.
https://www.olcf.ornl.gov/wp-content/uploads/2019/05/frontier...
https://rocm.github.io/
https://gpuopen.com/rocm-do-you-speaka-my-language/
https://gpuopen.com/compute-product/hcc-heterogeneous-compute...
https://gpuopen.com/compute-product/hip-convert-cuda-to-porta...
https://www.intel.com/content/www/us/en/high-performance-comp...
https://www.amd.com/en/products/frontier
https://www.olcf.ornl.gov/frontier/

Enligt AMD gänget på sweclockers 20 års fest har man i princip OpenCL-stödet i underhållsläge och rekommenderar i stället att använda HIP. AMDs OpenCL 1.2 stöd är riktigt bra, något man tyvärr inte kan säga om deras OpenCL 2.x stöd.

Frågade rakt ut vad de ansåg att man som utvecklare bör använda för att utveckla mot AMD GPUer. Rätt förvånad när svaret var: kör CUDA + HIP. Svårt att se CUDA på AMD GPUer som en seriös lösning då det inte finns någon teknisk specifikation för AMD att luta sig emot, CUDA är och blir vad Nvidia tycker är bäst för dem. Det gör att AMD alltid kommer ligga på efterkälken.

SYCL känns som en långt bättre försök att skapa en "öppen" variant av det CUDA erbjuder. För SYCL finns ju en öppen specifikation att luta sig mot, samt insikt i var kommande specifikation är på väg.

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Registrerad
Apr 2012
Skrivet av Yoshman:

Är just detta som är problemet, man är i praktiken fast på OpenCL 1.2 utanför Intels OpenCL implementation.

Detta är ett stort problem för moderna mer avancerade GPGPU-lösningar då stödet för att kunna använda pekare och behandla en minnesarea som direkt synligt både från CPU och GPU kräver minst OpenCL 2.0. Detta kallas unified memory (även i CUDA), Pascal och senare samt tror det är Vega och senare har HW-stöd för detta (Intel har ju alltid haft stöd för detta i sina iGPU, men från Broadwell eller om det är Skylake finns mer stöd för koherens så det än mer fungerar som mellan två CPU-kärnor).

Enligt AMD gänget på sweclockers 20 års fest har man i princip OpenCL-stödet i underhållsläge och rekommenderar i stället att använda HIP. AMDs OpenCL 1.2 stöd är riktigt bra, något man tyvärr inte kan säga om deras OpenCL 2.x stöd.

Frågade rakt ut vad de ansåg att man som utvecklare bör använda för att utveckla mot AMD GPUer. Rätt förvånad när svaret var: kör CUDA + HIP. Svårt att se CUDA på AMD GPUer som en seriös lösning då det inte finns någon teknisk specifikation för AMD att luta sig emot, CUDA är och blir vad Nvidia tycker är bäst för dem. Det gör att AMD alltid kommer ligga på efterkälken.

SYCL känns som en långt bättre försök att skapa en "öppen" variant av det CUDA erbjuder. För SYCL finns ju en öppen specifikation att luta sig mot, samt insikt i var kommande specifikation är på väg.

Jag hade inte nöjet att närvara vid träffen och konversera med Joe Macri.
Vilket segment avsåg det?
Att AMD hjälpte Blender att förbättra OpenCL stödet förstår jag och för liknande program var min uppfattning att det var OpenCL som gällde.
OpenCL 2. stöd verkar inte bre ut sig utan de flesta väljer fortfarande OpenCL 1.2 vilket jag kan förstå.
Även HIP kräver viss portning och jag har aldrig sett det som ersättare för andra compute gränssnitt utan för att porta t.ex en HPC till en AMD baserad HPC.
Frågan är hur lång tid det tar för SYCL att etablera sig.
Jag är intresserad av hur de ser på framtiden.

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av Snubb1:

Jag hade inte nöjet att närvara vid träffen och konversera med Joe Macri.
Vilket segment avsåg det?
Att AMD hjälpte Blender att förbättra OpenCL stödet förstår jag och för liknande program var min uppfattning att det var OpenCL som gällde.
OpenCL 2. stöd verkar inte bre ut sig utan de flesta väljer fortfarande OpenCL 1.2 vilket jag kan förstå.
Även HIP kräver viss portning och jag har aldrig sett det som ersättare för andra compute gränssnitt utan för att porta t.ex en HPC till en AMD baserad HPC.
Frågan är hur lång tid det tar för SYCL att etablera sig.
Jag är intresserad av hur de ser på framtiden.

Jag ställde specifikt frågan: "satsar inte längre AMD på OpenCL?". Svaret var "nej, bättre att använda använd CUDA via HIP".

OpenCL 1.2 duger inte längre. Utan OpenCL 2.x stöd är det allt fler viktiga HW-finesser som inte kan användas i GPUerna, den allra mest kritiska är det AMD kallar "high bandwidth cache" som egentligen bara är att GPU-delen kan dynamisk mappa in CPU RAM vid behov. Detta gör det möjligt att lösa väsentligt större problem med GPU, VRAM blir i det läget lite som en cache för "working-set" (rätt stor cache jämfört med vad en CPU har...).

OpenCL 2.x stöds av i alla fall Intel, ARM (Mali), Xilinx (d.v.s FPGAer) och Qualcomm (Ardreno), vilket täcker rätt enormt mer enheter. Problemet är att Nvidia totalt dominerar datacenter och då specifikt med CUDA. Även OpenCL 2.2 (som jag tror är senaste version) ligger klart efter CUDA, både i finesser man framförallt i "ease-of-use".

Du nämner Blender. Kolla prestanda Nvidia vs AMD i Blender 2.81, Nvidia ligger numera på en helt annan nivå. Får se om AMD+Intel kan ge Nvidia lite motstånd...

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Registrerad
Apr 2012
Skrivet av Yoshman:

Jag ställde specifikt frågan: "satsar inte längre AMD på OpenCL?". Svaret var "nej, bättre att använda använd CUDA via HIP".

OpenCL 1.2 duger inte längre. Utan OpenCL 2.x stöd är det allt fler viktiga HW-finesser som inte kan användas i GPUerna, den allra mest kritiska är det AMD kallar "high bandwidth cache" som egentligen bara är att GPU-delen kan dynamisk mappa in CPU RAM vid behov. Detta gör det möjligt att lösa väsentligt större problem med GPU, VRAM blir i det läget lite som en cache för "working-set" (rätt stor cache jämfört med vad en CPU har...).

OpenCL 2.x stöds av i alla fall Intel, ARM (Mali), Xilinx (d.v.s FPGAer) och Qualcomm (Ardreno), vilket täcker rätt enormt mer enheter. Problemet är att Nvidia totalt dominerar datacenter och då specifikt med CUDA. Även OpenCL 2.2 (som jag tror är senaste version) ligger klart efter CUDA, både i finesser man framförallt i "ease-of-use".

Du nämner Blender. Kolla prestanda Nvidia vs AMD i Blender 2.81, Nvidia ligger numera på en helt annan nivå. Får se om AMD+Intel kan ge Nvidia lite motstånd...

Jag har hört talas om förbättringar för Nvidia i Blender 2.81 men trodde det berodde på OptiX men jag ska inte säga för mycket då jag inte har full koll än.
Det är bara att inse att marknaden ständigt förändras och fort går det, man får anpassa sig efter marknaden istället för att försöka styra den.
Det är inte så viktigt vilka gränssnitt som används bara det fungerar bra om det sedan är CUDA via HIP eller OpenCL är oväsentligt.