Nvidia Hopper nästa arkitektur efter Ampere

Permalänk
Melding Plague

Nvidia Hopper nästa arkitektur efter Ampere

Nvidia har för vana att använda forskare som kodnamn för sina grafikarkitekturer. Nu fogas ett nytt namn till raden – Grace Hopper.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Jacob ditt busiga troll... Hur många läser fel baserat på titeln?

Jag gjorde...

Visa signatur

System: CPU: AMD Ryzen 9 3900X, MB: Gigabyte X570 Aorus Elite, Minne: Corsair 32GB DDR4 3200MHz, GPU: Asus GeForce RTX 2080 Super ROG Strix Gaming OC

Permalänk
Medlem

Läste visst fel på rubriken, trodde att dom skulle hoppa nästa arkitektur...

Permalänk
Medlem

Hittade en bild på kretsen som någon läckt:

Visa signatur

Citera så att jag hittar tillbaka! AMD Ryzen 7 5800X3D | MSI B450 Tomahawk Max | 32GB Ballistix @ 3733/16 | EVGA 2070 | Crucial MX500 2TB | EVGA G2 750W | Windows 10

Permalänk
Medlem

" där exempelvis Nvidia Geforce RTX 2000-serien kallas "Pascal" och AMD Radeon RX 5000-familjen är "Navi". "

Kallas inte Nvidia Geforce RTX 2000-serien för "Turing" ?

Visa signatur

🗄️ : NZXT H510 TG White . . . . . . . . . . . 🔌: Corsair RM750X White Series
🏬: MSI z370i Gaming Pro Carbon AC . 🎞️: Corsair 32GB DDR4 3000Mhz CL15
🔲: Intel Core i7 8700K @4.1Ghz . . . . . ❄️: Corsair Hydro H115i
💾: M.2 Samsung 960 EVO 500 GB .. . . 💾: Samsung 860 EVO 1 TB
🏴: MSI GF GTX 1080 Ti GamingX . . . . 🖥️: AOC AG241QG 1440p 165Hz GS

Permalänk
Trollfabrik 🫶🏻
Skrivet av FredrikMH:

Jacob ditt busiga troll... Hur många läser fel baserat på titeln?

Jag gjorde...

Det var faktiskt inte avsiktligt. På riktigt!

Skrivet av e-mad:

" där exempelvis Nvidia Geforce RTX 2000-serien kallas "Pascal" och AMD Radeon RX 5000-familjen är "Navi". "

Kallas inte Nvidia Geforce RTX 2000-serien för "Turing" ?

Ooops, fixat.

Visa signatur

Kontaktas enklast via PM. Önskas svar i forumet citera mina inlägg eller pinga @Jacob. Finns även på Twitter.

"Science and technology have progressed to the point where what we build is only constrained by the limits of our own imaginations." – Justin R. Rattner

Permalänk
Medlem
Skrivet av dannesthlm:

Läste visst fel på rubriken, trodde att dom skulle hoppa nästa arkitektur...

Samma här, höll på att sätta kaffet i halsen.

Permalänk
Avstängd
Skrivet av dannesthlm:

Läste visst fel på rubriken, trodde att dom skulle hoppa nästa arkitektur...

Jag också, tänkte ''nu är väl NoVideo lite väl självgoda''

Visa signatur

Ryzen 3600, Navi 5700.

Permalänk
Medlem

Om Nvidia kommer gå över till 7nm kommer AMD ha svårt igen att tävla mot dom.

Permalänk
Hjälpsam
Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Läste också lite för snabbt, tänkte "Vadå hoppa över nästa arkitektur?!"

Visa signatur

Corsair 600T | i7 6700K | MSI Z170A GAMING M5 | ASUS GTX 1080 8GB ROG STRIX |

Permalänk
Medlem

Så SLI i gigantiskt format.
Microsuttring från helvetet att vänta? 😁

Skickades från m.sweclockers.com

Permalänk
Medlem
Skrivet av Triton242:

Så SLI i gigantiskt format.
Microsuttring från helvetet att vänta? 😁

Skickades från m.sweclockers.com

Snarare att de lägger ut RT och Tensor core på separata kretsar till att börja med.

Permalänk
Avstängd

Vet vi ens att Ampere faktiskt heter Ampere?

Visa signatur

R7 3700X | X570 Aorus Master | 32GB | EVGA 1080 Ti FTW3 | Noctua NH-D15S | FD Meshify C Copper
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304
2 x HPE ProLiant Microserver Gen 8 | 1265L V2 | 16GB | 20TB

Permalänk
Rekordmedlem

Det blir allt en militär modell det när amiralskan ska stå för namnet.

Visa signatur

R5 5600G, Asus ROG STRIX X470-F Gaming, WD SN850X 2TB, Seasonic Focus+ Gold 650W, Aerocool Graphite v3, Tittar på en Acer ET430Kbmiippx 43" 4K. Lyssnar på Behringer DCX2496, Truth B3031A, Truth B2092A. Har också oscilloskop, mätmikrofon och colorimeter.

Permalänk
Medlem

@mrqaffe: Tack för klippet! Snacka om pedagogisk kvinna för övrigt, Letterman fick sig en riktig läxa

Visa signatur

Rigg: Intel i7 4790K @ 4,7 GHz delid | Noctua NH-U12S | Asus Z97-A | Corsair 2x4+2x8 GB 2133 MHz DDR3 RAM | EVGA RTX 2080 XC Ultra GPU | Intel SSD 2x 800 GB | Acer Predator XB271HU IPS skärm | M-Audio AV42 monitorer | HyperX Cloud 2-lurar | HyperX Pulsefire FPS mus

Permalänk
Medlem
Skrivet av Triton242:

Så SLI i gigantiskt format.
Microsuttring från helvetet att vänta? 😁

Skickades från m.sweclockers.com

Skulle inte förvåna mej om dom plankar AMD's CPU-design rakt av och kör två separata kärnor kopplat till ett externt chip som i sig kommunicerar med minnet. Någon slags intern nvLink kanske...

Permalänk
Medlem

@mrqaffe: Tackar för videon, vilken underbar kvinna.

Permalänk
Hjälpsam
Skrivet av mrqaffe:

Det blir allt en militär modell det när amiralskan ska stå för namnet.
https://www.youtube.com/watch?v=3N_ywhx6_K0

Vilken guldvideo!

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem
Skrivet av Dalton Sleeper:

Skulle inte förvåna mej om dom plankar AMD's CPU-design rakt av och kör två separata kärnor kopplat till ett externt chip som i sig kommunicerar med minnet. Någon slags intern nvLink kanske...

Det blir spännande att se första multichip GPU kortet. Jag funderade på om de kan använda hela utrymmet på en stor 7nm krets för klassisk spelgrafik, och sen använda extra kretsar för raytraycing och tensor/AI funktioner. Med tanke på att det inte är så många spel som stödjer RTX än. Sen kan de släppa kort utan stöd för RT bara genom att klippa bort den separata kretsen.

Permalänk
Medlem
Skrivet av Fulci:

Det blir spännande att se första multichip GPU kortet. Jag funderade på om de kan använda hela utrymmet på en stor 7nm krets för klassisk spelgrafik, och sen använda extra kretsar för raytraycing och tensor/AI funktioner. Med tanke på att det inte är så många spel som stödjer RTX än. Sen kan de släppa kort utan stöd för RT bara genom att klippa bort den separata kretsen.

Skulle bli förvånad om Amd inte har tagit patent på denna design med ryzen, men jag kan ha fel.
Men det hade varit trevligt om nVidia fick betala licenspengar till Amd för varje grafikkort dom tillverkar. 😄

Skickades från m.sweclockers.com

Visa signatur

Legion 5 Pro" Ryzen 5800H / 32GB ram / 2TB+1TB nvme / RTX 3070 8GB 140w

Permalänk
Datavetare

Hoppas Nvidia fortsätter att utveckla sina arkitekturer allt mer för GPGPU.

Jensen har raljerat om hur GPUer är så mycket snabbare än CPUer att de senare blir irrelevanta med tiden, nog ett visst mått av överdrift och eventuellt önsketänkande från Nvidias sida.

Men går inte att blunda för hur brutalt mycket bredare de områden som fungerar väl med GPGPU (specifikt CUDA) blivit med Turing. De flesta känner nog till Blender och med Turing drar till och med 1600-serien jämt med HEDT CPUerna, ställd mot Pascal med motsvarande teoretisk prestanda ligger Turing minst ett snäpp högre.

De förbättringar som gjorts kring hantering av heltal är egentligen ännu viktigare för GPGPU då en förkrossande majoritet av algoritmer jobbar med heltal. Går absolut inte att ersätta CPUer inom alla områden, men är idag lågt enklare att skriva kod i CUDA som faktiskt presterar riktigt bar om man kör på Turing jämfört med hur det såg ut ett par generationer tillbaka.

Redan lagt en hel del tid på det som diskuteras i denna tråd. När jag väl riktigt satt mig in i den algoritm som diskuteras flitigast där, Held Karp (en metod för att lösa handelsresandeproblemet) inses lätt att ett problem när man kör på en CPU är att "working-set" (mängden data som ofta används) är allt för stor för att få plats i CPU-cache när man når en bit över tjugo platser att besöka.

Vad är en GPU optimerad för? Just fallet där man hanterar så mycket data att det inte är rimligt att få plats med hela "working-set" i cache, i stället har man så många samtida trådar igång att varje tråd går så långsamt att läsa/skriva från VRAM inte blir en flaskhals!

Har inte postat CUDA-programmet, for nog lägga upp det på github eller så. Men även här står sig en 1660 Ti Max-Q krets sig riktigt väl mot en 3900X!!!

Tyvärr börjar Nvidia få lite väl stort försprång kring GPGPU. Frågade AMD-gänget på SweCs 20års jubileum om de slutat satsa på OpenCL (har haft känslan att det ligger till så, AMDs OpenCL 2.x implementation är inte bra). Svaret var rent ut: AMD tror inte längre på OpenCL, Apple skapade detta och ånga gick rätt mycket år det hela när Apple klev av och släppte stödet i sina OS.

Var ändå lite förvånad givet bristen på alternativ just nu och frågade: vad rekommenderar ni att man ska använda i stället? Svaret var lite märkligt "kör CUDA via HIP". Att köra ett proprietärt system, CUDA, emulerat/översatt till AMDs GPUer är väl OK för hobbybruk med inte en realistisk lösning för proffsbruk.

Hoppas här att AMD och Intel kan enas bakom t.ex. SyCL (Intel satsar definitivt på detta och fattar det som att AMD har börjat lägga in stöd i HIP för detta), för just nu vinner Nvidia rätt mycket på W.O. kring GPGPU

OpenCL hade egentligen aldrig någon chans mot CUDA, det senare är så mycket enklare att använda. SyCL är betydligt mer likt CUDA på en logisk nivå, så det kan bli riktigt bra.

TL;DR ser med spänning fram mot både Ampere och Hopper. Inte någon jätteskräll att det skulle komma en MCM-design, finns redan flera patent från Nvidia och en rad forskningspapper kring hur man kan tänkas bygga en MCM GPU. Fram till rätt nyligen fanns det tyvärr en hel del olösta problem, men 2017 verkar det som man själv trodde sig knäckt nöten.

Det är kanske Hopper?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Inaktiv
Skrivet av mrqaffe:

Det blir allt en militär modell det när amiralskan ska stå för namnet.

Jösses vilken krutgumma.

Jag har sett någon intervju eller kanske två med henne förut, men inte just den här. Tackar så mycket.

Ska bli intressant hur de löser problemet med en GPU som MCM. Grejen är ju att en GPU skyfflar runt så sanslöst mycket data internt, Ryzen Epyc spenderade ju några tiotals watt för att skicka runt något hundratal GB mellan de individuella CPU-chippen. En GPU flyttar runt mångdubbelt mer data, den största strömförbrukningsfaktorn i en GPU är ju redan att flytta data runt i kretsen (snarare än själva beräknandet på datan.) Om man ska korsa mellan två chips så brukar strömförbrukningen gå upp rejält, jag vet inte exakt hur mycket mer som behövs, men tio gånger mer energi för att skicka data mellan två chips än vad som går åt för kommunikation inom det verkar väl inte helt orimligt.

I en stor GPU som RX Vega64 eller GF2080/Ti så lär ju den totala interna datatrafiken inte längre handla om GB per sekund utan snarare många TB/s. Om man skulle skicka så mycket data mellan olika chiplets med dagens tekniker skulle ju strömförbrukningen formligen explodera... Nya genombrott kommer nog att krävas. Aktiva kiselbryggor mellan kretsarna kanske kan hjälpa, dvs man bakar in signalförstärkande transistorer i ledningsbanorna, så att I/O-drivkretsarna i varje chiplet kan göras mindre och strömsnålare.

Sedan ökar ju latency också med MCM jämfört med monolitisk. Särskilt om fler transistorer finns på vägen kan nämnas... Nu brukar GPUer vara bra på att hantera sånt, men ännu mer blir ju ytterligare en börda för teknikerna så att inte IPC/strömförbrukning blir onödigt lidande.

Så det blir intressant...! Dock, säkert minst ett par års väntan till eller eventuellt mer innan vi vet vad vi kan förvänta oss.

Permalänk
Medlem
Skrivet av e-mad:

" där exempelvis Nvidia Geforce RTX 2000-serien kallas "Pascal" och AMD Radeon RX 5000-familjen är "Navi". "

Kallas inte Nvidia Geforce RTX 2000-serien för "Turing" ?

Skrivet av Jacob:

Ooops, fixat.

Var inte det mer eller mindre "Pascal" med några Tensor kärnor och högre frekvens/effekt?
Och då Tensor kärnorna mer eller mindre är för RTX, så... är det väl inte så fel?

Skrivet av jehuty:

Om Nvidia kommer gå över till 7nm kommer AMD ha svårt igen att tävla mot dom.

Notera dock, det är inte TSMCs 7nm, utan Samsungs om jag förstått det rätt. Hur dessa skalar i frekvens och effektivitet är mao en vild fråga. De är ute på en EUV nod, vilket är rätt kraftigt oprövad, något som också troligen förklarar MCM designen.

Och då det är helt ny design kan du inte tro det blir ett 2000 kort med 7nm fördel, utan det kan bli allt mellan tomat och ketchup. Vi får se mao... Deras 2080Ti blir ju deras egen fiende i första kampen.

Permalänk
Trollfabrik 🫶🏻
Skrivet av Paddanx:

Var inte det mer eller mindre "Pascal" med några Tensor kärnor och högre frekvens/effekt?
Och då Tensor kärnorna mer eller mindre är för RTX, så... är det väl inte så fel?

Nej, Turing är arkitektoniskt väldigt annorlunda i övrigt också. Pascal var däremot "Maxwell på steroider" vilket i stort möjliggjordes av övergången från 28 till 16 nanometer.

Visa signatur

Kontaktas enklast via PM. Önskas svar i forumet citera mina inlägg eller pinga @Jacob. Finns även på Twitter.

"Science and technology have progressed to the point where what we build is only constrained by the limits of our own imaginations." – Justin R. Rattner

Permalänk
Medlem
Skrivet av Jacob:

Nej, Turing är arkitektoniskt väldigt annorlunda i övrigt också. Pascal var däremot "Maxwell på steroider" vilket i stort möjliggjordes av övergången från 28 till 16 nanometer.

Ahh så var det ja.

Permalänk
Avstängd
Skrivet av Nyhet:

Nvidia har för vana att använda forskare som kodnamn för sina grafikarkitekturer. Nu fogas ett nytt namn till raden – Grace Hopper.

Läs hela artikeln här

Latens problem med MCM så troligen AI kort

Visa signatur

Träna bort dyslexin. Ryzen 3600 - asus B350plus - Msi Vega56 - Acer 1440p 144hz - M.2 ssd - asus essence stx - Sennheiser hd600 - Corsair 750w - 16gb ram 3ghz - atcs 840 - luftkylt - Felsökning? (Lär dig Googla)