Intel visar Xe-grafik för datacenter – får Threadripper att se liten ut

Permalänk
Melding Plague

Intel visar Xe-grafik för datacenter – får Threadripper att se liten ut

Den massiva Xe-kretsen som får smeknamnet "alla grafikkorts fader" ska hantera likvärdigt massiva beräkningar i datacenter.

Läs hela artikeln här

Permalänk
Tangentbordskonnässör

Det var ingen dålig krets det där.. MEN! Är det inte @Kenneth som är "Baap of All" (Ba baap) ?
Dags att skicka juristerna på Intel!

Permalänk
Medlem
Citat:

Grafikkretsen i det högpresterande segmentet Xe-HP riktas alltså in mot datacenter och blir därmed en konkurrent till AMD:s Radeon Pro- och Nvidias Quadro-produkter.

Det lär väl snarare vara en konkurrent till AMD Radeon Instinct och NVIDIA Tesla? Radeon Pro och Quadro är ju workstation-kort, inte serverkort.

Permalänk
Lyxfällan 🎮

@perost: Xe-HP riktas mot både workstation och lättare HPC, medan Xe-HPC riktas mot just Radeon Instinct och Tesla. Jag misstänker att Xe-HP kommer göra avstamp i flera av AMD:s och Nvidias produktserier.

Permalänk
Medlem

Den är stor för att den är i 14nm

Permalänk
Master of Overkill
Skrivet av perost:

Det lär väl snarare vara en konkurrent till AMD Radeon Instinct och NVIDIA Tesla? Radeon Pro och Quadro är ju workstation-kort, inte serverkort.

Du kör quadro i server med

Permalänk
Medlem

Kanske är det en chiplet design under locket.
Annars blir jag orolig om intel tvingas utveckla så enorma kretsar för att kunna konkurrera vilket även kommer avspegla sig i priset.

Permalänk
Medlem
Skrivet av Snubb1:

Kanske är det en chiplet design under locket.
Annars blir jag orolig om intel tvingas utveckla så enorma kretsar för att kunna konkurrera vilket även kommer avspegla sig i priset.

Du ska se det som ännu ett försök från Intel att övertyga marknaden om att de har något nytt och stort på gång.
Multi-chip Module (MCM) är samma typ av teknik som AMD använt under en tid och som man kallar för chiplet-design.

Ska man vara lite elak så är det här yttersta beviset på att Intel nu överger sin gamla Core-arkitektur och satsar på det de innan kallade för "hoplimmade kretsar". Tydligen visade sig 7nm och "lim" vara framtiden – även för Intel.

Permalänk
Moderator, Testpilot
Skrivet av Snubb1:

Kanske är det en chiplet design under locket.
Annars blir jag orolig om intel tvingas utveckla så enorma kretsar för att kunna konkurrera vilket även kommer avspegla sig i priset.

Det är nog snarare så att det är helt säkert att det är en multi-chip design. Allt tyder på det.

Permalänk
Medlem

Det var ingen liten pjäs inte....

Permalänk
Medlem
Skrivet av tvelander:

Du kör quadro i server med

Visst, men de marknadsförs som workstation-kort.

Skrivet av Fikabulle:

Ska man vara lite elak så är det här yttersta beviset på att Intel nu överger sin gamla Core-arkitektur och nu satsar på det de innan kallade för "hoplimmade kretsar". Tydligen visade sig 7nm och "lim" vara framtiden – även för Intel.

Intel har en mycket längre historia med limmade kretsar än AMD. Pentium D var t.ex. två limmade kretsar, och nuvarande Cascade Lake-AP även så.

Det var aldrig själva "limmet" som var problemet med första generationen Epyc, utan att sättet som AMD implementerade det på ledde till inkonsekvent prestanda (samma problem som Pentium D hade mer än 20 år tidigare). AMD har jobbat mycket på just den biten och förbättrat efterkommande generationer avsevärt på det området.

Permalänk
Medlem

När ska jag någonsin få spela Crysis med Ultra med Intel Xe-kort? Orkar inte vänta längre!

Permalänk
Medlem

Hah, alla grafikkorts fader? Ja då får den prestera därefter också! Blir pinsamt för Intel annars.

Permalänk
Medlem

Har noll och intet att göra med "vanliga" datorer, gaming eller inte.
Däremot kanske den hamnar i andra ändan av spelet där den jobbar på att skapa en så exakt profil av dig som det bara går.

Permalänk
Master of Overkill
Skrivet av perost:

Visst, men de marknadsförs som workstation-kort.
Intel har en mycket längre historia med limmade kretsar än AMD. Pentium D var t.ex. två limmade kretsar, och nuvarande Cascade Lake-AP även så.

Det var aldrig själva "limmet" som var problemet med första generationen Epyc, utan att sättet som AMD implementerade det på ledde till inkonsekvent prestanda (samma problem som Pentium D hade mer än 20 år tidigare). AMD har jobbat mycket på just den biten och förbättrat efterkommande generationer avsevärt på det området.

Va det marknadsförs mot konsumenter globalt är ointressant och som står på deras sida vs va dom faktiskt säljer korten för.

Lite som Xeon blir samma sak, gjort för "workstation" men det som säljs mest är server.

PR mot workstation säljer bättre globalt än om du har server på fronten.
Mer bilden ovan som är det intressanta.

Och detta som är dom stora sales, speciellt GPU render farmar av supermicro och annat.

Permalänk
Medlem

undrar hur många chiplet/kretsar det sitter i detta monster skulle gissa på 4st så om man delar ytan med 4a 3700/4 = 940mm2, om så e fallet så e den fortfarande gigantisk eller om detta e den med 8a chiplet/kretsar 3700/8=470 så hamnar den mittemellan AMDS & Nvidias kretsar storleksmässigt vilket inte verkar så osannolikt, ser fram mot när vi har 3 aktörer

Permalänk
Medlem
Skrivet av tvelander:

Va det marknadsförs mot konsumenter globalt är ointressant och som står på deras sida vs va dom faktiskt säljer korten för.

Nu har jag ingen statistik på det, men Quadro-kort är ju väldigt vanliga i både stationära och bärbara workstation-datorer. Jag har svårt att se att NVIDIA säljer mer Quadro-kort för serveranvändning eftersom det då mest handlar om de dyrare modellerna (RTX Server har t.ex. stöd för RTX 6000 och 8000, så minst 50-60k per kort).

Men visst, vill du räkna Quadro som serverkort så får du väl göra det. Det förändrar inte faktumet att Tesla är deras renodlade serverkort.

Skrivet av tvelander:

Lite som Xeon blir samma sak, gjort för "workstation" men det som säljs mest är server.

Xeon är en väldigt bred familj processorer som riktar sig mot både workstation, server och embedded. Eller vad räknar du som Intels serverprocessorer?

Permalänk
Medlem

Är detta den första MCM/chiplet-designade grafik/beräknings-kretsen?
I så fall har ju Kadori inte helt fel att detta är fadern...

Permalänk
Medlem
Skrivet av ThomasLidstrom:

Är detta den första MCM/chiplet-designade grafik/beräknings-kretsen?
I så fall har ju Kadori inte helt fel att detta är fadern...

ATI/AMD hade ju 295x2 som var en multichip gpu, men kanske inte jämförbart, var väl iofs Kadori som låg bakom den också?

Permalänk
Medlem
Skrivet av [SmR]BMF:

ATI/AMD hade ju 295x2 som var en multichip gpu, men kanske inte jämförbart, var väl iofs Kadori som låg bakom den också?

Det var väl två grafikkretsar som kördes på samma bräda mot varandra via Crossfire. Så nej, inte jämförbart.

Dold text
Permalänk
Medlem
Skrivet av jeffan97:

Hah, alla grafikkorts fader? Ja då får den prestera därefter också! Blir pinsamt för Intel annars.

Nja kan ju mycket väl stämma då alla föräldrar vet att man alltid gör sin avkomma bättre än sig själv..

Så med det i åtanke så kommer detta vara det sämsta av allt

Permalänk
Medlem

Att headspreadern är på nära 4000mm^2 behöver inte betyda att kiselytan under är ens i närheten av det? Storleken på sockeln bestäms väl mer av antalet kontaktpinnar. Dessutom om det är chiplets så går en hel del yta förlorad på avstånden mellan chipleten. Och det kan ju inte vara annat än chiplets, för annars når man snabbt upp i maximala ytan man kan tillverka.

Permalänk
Medlem
Skrivet av jeffan97:

Hah, alla grafikkorts fader? Ja då får den prestera därefter också! Blir pinsamt för Intel annars.

Fast nu la du in lite egna ord där. Det är inte det färdiga grafikkortet han pratar om utan kretsen i sig. Och inte prestanda, utan storlek. I alla fall som huvudfokus.

Permalänk
Medlem
Skrivet av perost:

Visst, men de marknadsförs som workstation-kort.
Intel har en mycket längre historia med limmade kretsar än AMD. Pentium D var t.ex. två limmade kretsar, och nuvarande Cascade Lake-AP även så.

Det var aldrig själva "limmet" som var problemet med första generationen Epyc, utan att sättet som AMD implementerade det på ledde till inkonsekvent prestanda (samma problem som Pentium D hade mer än 20 år tidigare). AMD har jobbat mycket på just den biten och förbättrat efterkommande generationer avsevärt på det området.

Men Intel hoppade inte på hur AMD anammade det utan hela argumentet var riktat mot "Ihoplimmade kretsar".

Permalänk
Datavetare
Skrivet av Xinpei:

Men Intel hoppade inte på hur AMD anammade det utan hela argumentet var riktat mot "Ihoplimmade kretsar".

Inte sant, detta är exakt vad det hela refererande till

Två saker var klantigt från Intels sidan med detta: användningen av ordet "desktop die" samt egentligen att överhuvudtaget påpeka just detta då just det problemen var redan något tester noterat och tagit upp som nackdel.

Intel har använt MCM väldigt länge, Pentium D är redan nämnt, Core2Quad är ett annat. Men framförallt är varenda U/Y-serie CPU som Intel tillverkar en MCM. Man har ju också patent på ett "superlim" i form av EMIB, en teknik som lär användas i kretsen i artikeln.

Denna slide nämner dock något som är långt viktigare än rå kretsprestanda:ekosystem. Det är huvudorsaken till varför Nvidia totalt dominerar GPGPU-marknaden, fram till nu har inget kommit nära CUDA i enkelhet och kvalité kring programutveckling. Jensen har sagt vad han anser om Intels oneAPI.

Efter att börja testat oneAPI förstår jag varför Nvidia gör precis som Intel gjorde mot Epyc; väldigt mycket tyder på att Intel faktiskt fått till något som på flera sätt är enklare att använda än CUDA!

För GPGPU-delen bygger oneAPI på en öppen standard som kallas SyCL. SyCL togs initialt fram av ett företag som heter CodePlay, av experter på heterogena system och experter på C++. Kombinationen är kritiskt här, för vad man (till skillnad från OpenCL) lyckats med är att ta fram en teknik som

  • är enkelt för kompilatorer att optimera, i SyCL beskrivs databeroenden mellan de olika delarna på ett sätt som kompilatorn kan utnyttja till att göra optimeringar (både OpenCL och CUDA saknar detta, motsvarande optimering måste göras manuellt). Mycket av de som görs här kommer av forskning kring kompilatorteknik, mesta av dessa idéer är idag realiserade i LLVM, vilket också är tekniken Intel bygger oneAPI på

  • SyCL hittar inte på egna tekniker, utan man använder standard "modern" C++ (C++11 och senare), "one" delen i oneAPI refererar till att exakt samma C++ kan köras CPU, GPU eller FGPA. Allt kompileras för varje acceleratortyp och därmed optimeras separat, men beskrivningen (i.e. källkoden) är densamma för alla.

  • Precis som CUDA, och till skillnad från OpenCL, skriver man GPGPU-koden och CPU-koden i samma fil. Det förenklar överblicken då man kan lägga saker där de logiskt hör hemma

oneAPI kör en utökad variant av SyCL, men Intel jobbar på att få in alla utökningar i nästa version av SyCL (som hanteras av samma organisation som hantera Vulkan, OpenGL, OpenCL, m.fl. Khronos). Även här har man undvikit "not invented here" syndromet. Tilläggen kommer från finesser i 2020 års ISO C++ standard (är klart att de kommer, men C++20 är inte formellt lanserad än), så även dessa passar perfekt in i "vanlig" C++ kod.

Ovanpå det har Intel lagt väldigt mycket krut på att integrera deras MKL (Math Kernel Library, ett bibliotek som används väldigt mycket på HPC, neuronnätverk och program som Matlab). Det är också ett genidrag (om det nu fungerar, denna del har jag inte hunnit testa). MKL används mycket, men det har fram till nu varit CPU-only. Genom oneAPI kan man köra samma saker på GPU, det betyder att t.ex. Matlab och TensorFlow kan använda Intels GPU (är här AMD/Intel/alla-förutom-Nvidia tidigare misslyckats p.g.a. undermåligt programvarustöd).

Resultatet av det kommer bli att Tiger Lake och andra som kör Xe (Rocket Lake?) kommer nå en helt ny prestandanivå i de program som använder MKL, vilket är många program inom forskning och simulering. Detta är ett område som tidigare i praktiken bara fungerade på GPUer via CUDA och CPUer via MKL (med MKL används SSE/AVX/AVX-512, fungerar så klart på CPU utan detta men då med långt sämre prestanda)!

En sak som går i teorin, men är väldigt bökigt i praktiken med CUDA, är att parallellt använda CPU+GPU för att lösa samma problem. Det är p.g.a. oneAPIs design väldigt enkelt där, något som kan visa sig bli väldigt värdefullt på bärbara med begränsade resurser. Detta är egentligen exakt vad AMD siktade på med köpet av ATI, i.e. det var tanken med "fusion". Problemet där har alltid varit att man så här långt inte fått fram en vettig programmeringsmodell. Möjligen kan Raja Koduri få till sin vision denna gång...

Permalänk
Medlem
Skrivet av Ase:

undrar hur många chiplet/kretsar det sitter i detta monster skulle gissa på 4st så om man delar ytan med 4a 3700/4 = 940mm2, om så e fallet så e den fortfarande gigantisk eller om detta e den med 8a chiplet/kretsar 3700/8=470 så hamnar den mittemellan AMDS & Nvidias kretsar storleksmässigt vilket inte verkar så osannolikt, ser fram mot när vi har 3 aktörer

Där försvinner rätt mycket yta på tomrum i chiplet design så tyvärr inte relevant att räkna så

Permalänk
Medlem
Skrivet av jawik:

Det var väl två grafikkretsar som kördes på samma bräda mot varandra via Crossfire. Så nej, inte jämförbart.

Tycker nog att det är jämförbart, två chip på ett substrat och ett hårdvaru/mjukvaru interface för att låta kretsarna kommunicera med varandra. Sannolikt är intels variant av bättre på alla punkter än crossfire men faktum kvarstår.

Permalänk
Medlem
Skrivet av [SmR]BMF:

Tycker nog att det är jämförbart, två chip på ett substrat och ett hårdvaru/mjukvaru interface för att låta kretsarna kommunicera med varandra. Sannolikt är intels variant av bättre på alla punkter än crossfire men faktum kvarstår.

Ja lite tokigt ordval av mig där. Man kan naturligtvis jämföra med vad man vill. Min poäng var att då det i fallet med Radeon R9 295X2 var två grafikkretsar på samma bräda som kördes via Crossfire internt på kortet, så blir jämförelsen ganska nära i sak som att jämföra mellan två separata kort som körs i Crossfire externt. Crossfires nackdelar var samma i båda fallen.

Men jag är inte så insatt tekniskt i hur Radeon R9 295X2 faktiskt var uppbyggt och eventuella skillnader, så jag ska inte säga mer om detta. Du har rätt i att det finns en valid jämförelsepunkt. Jag är bara osäker på hur relevant den är ställt mot Intels version.

Permalänk
Medlem
Skrivet av jawik:

Ja lite tokigt ordval av mig där. Man kan naturligtvis jämföra med vad man vill. Min poäng var att då det i fallet med Radeon R9 295X2 var två grafikkretsar på samma bräda som kördes via Crossfire internt på kortet, så blir jämförelsen ganska nära i sak som att jämföra mellan två separata kort som körs i Crossfire externt. Crossfires nackdelar var samma i båda fallen.

Men jag är inte så insatt tekniskt i hur Radeon R9 295X2 faktiskt var uppbyggt och eventuella skillnader, så jag ska inte säga mer om detta. Du har rätt i att det finns en valid jämförelsepunkt. Jag är bara osäker på hur relevant den är ställt mot Intels version.

Inte särskilt, mer än att det i båda fallen är mer än en grafikkrets på ett och samma substrat

Permalänk
Medlem

@[SmR]BMF: Osäker vad ni refererar till när säger substrat men varken crossfire på eller mellan två brädor är på samma substrate? Intel menar nog att dom är på samma silikon substrat d.v.s. wafer.