Nvidia arbetar på alternativ till AMD Smart Access Memory

Permalänk
Medlem

AMD uppfinner och Nvidia kopierar. Som vanligt.

Så ruttet.

Visa signatur

Ryzen 7800X3D
32GB DDR5
RX 7900XT

Permalänk
Skrivet av Knightmare:

Jag förstår inte hur "resizable BAR" kan påverka prestanda mer än inom felmarginalen. BAR mappad data används ju bara för att läsa och skriva bit's, typ register. Om det är datamängder att snacka om så använder man DMA och där kan man skyffla GB utan att ha någon BAR.

Jo, som jag förstått det är SAM mer än bara en justerbar BAR. Den som väntar får se, 18e smäller det!

Visa signatur

i7 6700k @4,1 base - 4,4 Turbo | XFX 590X Fatboy | Gigabyte Z270 D3 | 2x16 GB Corsair Vengence 3200MHz Cl 16| Intel 750 400GB |EVO 970 1 TB Steamdrive| 64TB thin provision

Permalänk
Medlem
Skrivet av SectionX2:

AMD uppfinner och Nvidia kopierar. Som vanligt.

Så ruttet.

haha, nu vet jag inte riktigt vad du menar? har väl kopierats fram och tillbaka sedan begynnelsen? Senaste åren skulle jag säga att det varit tvärtom dvs AMD som försökt haka på Nvidia. Men du får gärna ge exempel

Visa signatur

7800x3D | Asus Strix 4090 OC | x670 MSI Pro WIFI | 6000Mhz 32GB CL30 DDR5 | SN850X 2GB | NH-DH15 Chromax Black| Fractal North Mesh | TUF 1000W Gold | Samsung Neo G8 32' 4K 240hz | Mac M2 |

Permalänk
Medlem
Skrivet av Ase:

AMD som alltid prisas för öppna standarder & nvidia som alltid får skit för låsta! Ser vi kanske ett tronskifte även där? gillar öppna standarder oberoende plattform eller tillverkare, därav att inte apple, sony ligger så högt i kurs hos mig. Hoppas verkligen inte AMD nu går mot låst plattform a la Apple, sony nu när de inte är underdog längre.

Nvidia är fria att implementera stöd för SAM i sina grafikkort och Intel är fria att implementera det i sina processorer. Det är inte låst till AMD.

Permalänk
Medlem
Skrivet av Feeku:

Ser inte vad som är öppet (eller låst) med denna feature. NVIDIA säljer inga x86 Cpuer och har ingen anledning till att binda sig till enbart Intel eller AMD. Denna lösning stödjer ju fortfarande bara NVIDIA kort?

Mer till att AMD framställt det som något som man behöver köpa specifika CPUer och chipset till medan Nvidia rycker på axlarna och säger "det här kan vi få igång, vart i PCIe specen samt i Microsoft's dokumentation sen 2017" (fet paraphrase, men typ). Sen är det hundra procent vettigt att Nvidia agerar som de gör men det är ändå lustigt.

Dock kan det finnas nyanser i AMDs implementation som gör att de bara vill tillåta det på hårdvaran de valt. De får förklara mer ingående nån gång inom snar framtid.

Skrivet av Ratatosk:

I DirectX körs Raytracing på DXR, RTX är Nvidias hårdvara för DXR, AMD:s kommande hårdvara för DXR heter något annat, vet inte vad.

Jo tack vet, men Nvidia kallar deras hårdvara som klarar av realtidsraytracing (på hyfsat kapabel nivå och uppåt) för RTX vilket var det enda jag var ute efter där.

Visa signatur

i7-2700K 5GHz | 16GB DDR3-1600 | ASUS Maximus V Gene | GTX 980

Permalänk
Medlem
Skrivet av Paontuus:

SAM på Linux används redan och har funnits ett tag, det är inte exklusivt till zen3 och rdna2.

Korrigering att "resizable BAR" används på Linux.

AMD har väl inte specificerat precis vad SAM egentligen gör annat än att "göra hela VRAM tillgängligt för CPU". Det är väl möjligt att SAM har andra specifika hårdvarulösningar som ytterligare ökar på prestandavinsterna?

Permalänk
Medlem
Skrivet av Snubb1:

Jag har svårt att se nyheten då Nvidia sa samma sak när smartshift presenterades till laptop att nvidia skulle ha en liknande lösning och nu när smartshift blivit smart access memory för desktop så upprepar även nvidia påståendet.
Är det någon som hört om det blev något liknande på laptops eller om uttalandena endast var marknadsföring?
Frågan jag ställer mig är hur stor skillnad kommer nvidias lösning kunna åstadkomma?
Jag gissar att nvidia kanske kan uppnå 1-2% i normalfallet vilket knappt kommer vara märkbart, att jämföra med amd som troligtvis kan uppnå 2-6% i normalfallet då amd egna siffror visar 5-6% (samt ett extremt undantag av 11% vilket jag bortser ifrån då det avviker mot alla andra resultat).

Vad baserar du gissningen att nvidia kommer få mycket lägre prestandavinst med samma feature på? Känns som en märklig sak att säga utan en motivering tycker jag.

Permalänk
Medlem
Skrivet av Knightmare:

Jag förstår inte hur "resizable BAR" kan påverka prestanda mer än inom felmarginalen. BAR mappad data används ju bara för att läsa och skriva bit's, typ register. Om det är datamängder att snacka om så använder man DMA och där kan man skyffla GB utan att ha någon BAR.

SAM innebär väl att CPU:n kan använda grafikkortets minne,vilket är mycket snabbare än vanligt primärminne.
Det jag inte förstår dock är hur det kan vara snabbare... Att gå via PCIe 4.0-bussen etc med extra latens det innebär borde ju vara slöare.

Permalänk
Medlem
Skrivet av Cocosoft:

Vi vet inte ens hur 6000-serien kommer att prestera (annat än AMDs egna benchmarks...). Lite väl tidigt att komma till en slutsats redan nu?

fanboys är alltid fanboys, jag köper det som ger mest prestanda per krona

Visa signatur

R7 5800X3D / RX 6950 XT / 32GB Ram / 1TB SSD / X570 Bräda / 850w Nätagg.
32 Tums Skärm 1440p 144hz Curved VA panel.

Permalänk
Medlem
Skrivet av Cocosoft:

SAM innebär väl att CPU:n kan använda grafikkortets minne,vilket är mycket snabbare än vanligt primärminne.
Det jag inte förstår dock är hur det kan vara snabbare... Att gå via PCIe 4.0-bussen etc med extra latens det innebär borde ju vara slöare.

PCIE4.0 bussen är säkert en flaskhals, men å andra sidan är GDDR6 ca 10x snabbare än vanligt RAM så det finns säkert en del att hämta. Särskilt om det är sånt som GPU behöver, då SLIPPER man att gå över bussar om det redan ligger i GDDR(ja, RAM har också en buss).

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Permalänk
Avstängd

Vi får väll se om nvidia lyckas.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.

Permalänk
Medlem
Skrivet av Cocosoft:

SAM innebär väl att CPU:n kan använda grafikkortets minne,vilket är mycket snabbare än vanligt primärminne.
Det jag inte förstår dock är hur det kan vara snabbare... Att gå via PCIe 4.0-bussen etc med extra latens det innebär borde ju vara slöare.

SAM handlar ju inte om att använda VRAM istället för RAM. Det handlar om att CPU tillåts utföra fler moment direkt mot "frame buffer" som redan finns i VRAM. Alltså att öppna upp för en genväg till arbetet som ska utföras. Annars måste traditionellt data kopieras till RAM innan det berarbetas av CPU och sedan tillbaka.

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Medlem

Läs artikeln det handlar om en standard för & i pci-e bussen

Visa signatur

Arne Berg

Permalänk
Medlem

@Joppis Hur är detta inte samma sak?

Skrivet av Joppis:

SAM handlar ju inte om att använda VRAM istället för RAM.

Skrivet av Joppis:

Det handlar om att CPU tillåts utföra fler moment direkt mot "frame buffer" som redan finns i VRAM.

Vad du säger här tycks ju vara att man använder VRAM istället för RAM.

Permalänk
Medlem
Skrivet av Cocosoft:

@Joppis Hur är detta inte samma sak?

Vad du säger här tycks ju vara att man använder VRAM istället för RAM.

Det jag menar är att framebuffern redan existerar i VRAM. Man låter CPU accessa denna data direkt utan att gå via RAM. Det är alltså inte ny data som placeras i VRAM istället för RAM.

Detta sker även utan SAM men med SAM utvidgas området som är tillgänglig för CPU.

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Hedersmedlem
Skrivet av SectionX2:

AMD uppfinner och Nvidia kopierar. Som vanligt.

Så ruttet.

Det är väl bra om Nvidia kopierar saker? Alternativet är att tillverkare A uppfinner en funkltion som tillverkare B sedan inte implementerar för att det vore att "kopiera".

Ungefär som om AMD inte hade kopierat stöd för raytracing...

Permalänk
Medlem
Skrivet av SectionX2:

AMD uppfinner och Nvidia kopierar. Som vanligt.

Så ruttet.

Fast enligt dokumentationen ifrån 2008 så var det Hewlett Packard samt Advanced Micro Devices (AMD) som fick in detta i PCIE 2.0.

Men kom ihåg att man måste ha en 5k-serie Ryzen + 5-serie moderkort och 6000-GPU för att det ska stödjas

Apple kör unified memory istället och småler åt SMA

Visa signatur

I5 9600k@stock / Cooler Master Evo 212 / Gigabyte Z390 Gaming X / Corsair Vengeance LPX 16GB DDR4 3000MHz / MSI RTX2070 Gaming Z / EVGA 550 BQ / Asus VG27BQ 27" 165Hz

Ryzen 5 5600x@stock / Asus Rog Strix X570-E Gaming / Corsair Vengeance RGB Pro 16GB 3600MHz CL18 / MSI RTX3070 Suprim X / BeQuiet Pure Power 11 600W / Asus VG278Q 27" 144Hz

Permalänk
Medlem
Skrivet av Joppis:

Det jag menar är att framebuffern redan existerar i VRAM. Man låter CPU accessa denna data direkt utan att gå via RAM. Det är alltså inte ny data som placeras i VRAM istället för RAM.

Detta sker även utan SAM men med SAM utvidgas området som är tillgänglig för CPU.

Ja, men CPUn tillåts väl göra arbiträra operationer på detta space? Precis, varför det inte var så användbart förr var väl för att det var begränsat till 128MB, tills nu då PCIe-protokollet samt operativsystemen tillåter en att allokera en större yta.

Permalänk
Medlem

Jag påpekar än en gång det nvidia ska lägga till är en standard som finns i pci-e gränssnittet har inget med amd s så kallade lösning att göra utan med att man kan skicka mer data över pci-e bussen till tex ett grafikkort. samt använda vram på ett mer effektivt sätt det är inte ett trolleri som amd uppfunnit. (även om deras lösning kanske ser annorlunda ut för att låsa till sig kunder med krav på en enhetlig amd plattform.)

Visa signatur

Arne Berg

Permalänk
Medlem

Rätt skönt att det här är en marknad med konkurrens igen dock. Märker verkligen att det ska kontras hela tiden så fort någon tar något som kan uppfattas som en "edge".

Permalänk
Medlem

Jag har alltid fått för mig om att SMA är ungefär som när man hade en gammal dator på 80talet som säg hade 128kB ram.
Jag kan ha helt fel, SMA kanske är helt annorlunda.

Problemet då med processorn man ägde var att den bara hade 16 bitars addresslina så man kunde bara se 64kB ram med processorn, vilket då blir lite problemetatiskt när man hade 128kB.

Så då fick man helt enkelt ha minnet i olika "banker" eller "pages" eller vad det nu kallades för.

Så bank A hade 0-64kB, och bank B hade 65-128kB förenklat sett.

Istället för att kunna se hela minnet med en gång på 128kB och enkelt addressera denna.

Lite så har jag fått för mig att SMA är, att med detta enablat så ser man hela minnesmängden istället för en mindre del åt gången.

Visa signatur

I5 9600k@stock / Cooler Master Evo 212 / Gigabyte Z390 Gaming X / Corsair Vengeance LPX 16GB DDR4 3000MHz / MSI RTX2070 Gaming Z / EVGA 550 BQ / Asus VG27BQ 27" 165Hz

Ryzen 5 5600x@stock / Asus Rog Strix X570-E Gaming / Corsair Vengeance RGB Pro 16GB 3600MHz CL18 / MSI RTX3070 Suprim X / BeQuiet Pure Power 11 600W / Asus VG278Q 27" 144Hz

Permalänk
Medlem

Intresant detta kan få oss att vilja ha PCI express 6.0 i AM5 sockeln och Intels motsvarande, samt om Nvidea får de funka över alla CPU så kan det bli så att AMD mirakulöst lyckas få till det samma.

Konkurans konsument win/win!

Permalänk
Medlem
Skrivet av SectionX2:

AMD uppfinner och Nvidia kopierar. Som vanligt.

Så ruttet.

Så världen fungerar typ, ren och skär innovation är extremt ovanlig.

Visa signatur

You have earned my respect and my friendship.

Permalänk
Skrivet av Thor:

Är mer intresserad av vad de 5-11% som Amd nämner innebär i realiteten.

Jag kanske har missat när man ser denna ökade prestandan?

Handlar det om en specifikt applicerbar teknik på en del av spelen som finns/kommer frammöver, eller är det en mer generell ökning över hela brädet?

Ordvalet i artikeln får mig att tolka applikationen till specifika förhållanden där prestandan kan hämtas hem. Innebörden av det beror då helt på hur specifik applikationen är.

Tidigare har det varit ett fönster (256mb) mellan drivrutinen och grafikminnet.
Nu är väggen borta. Det avkomplicerar drivrutinen. Alla vinner.

stav
Permalänk
Medlem
Skrivet av FattarNiInte:

Tidigare har det varit en fönster (256mb) mellan drivrutinen och grafikminnet.
Nu är väggen borta. Det avkomplicerar drivrutinen. Alla vinner.

Förtydligandet uppskattas, tack!

Visa signatur

You have earned my respect and my friendship.

Permalänk
Hedersmedlem
Skrivet av UncleDirty:

Intresant detta kan få oss att vilja ha PCI express 6.0 i AM5 sockeln och Intels motsvarande, samt om Nvidea får de funka över alla CPU så kan det bli så att AMD mirakulöst lyckas få till det samma.

Konkurans konsument win/win!

???

Denna teknik funkar med PCIe Gen 3 och sannolikt också Gen2 också

Permalänk

L3 GPU cache

Skrivet av Mr[M]:

2% till 6% mer prestanda är ju inte direkt livsavgörande men det kanske kommer vara mera i framtiden ska bli roligt se hur Nvidia kommer lösa detta och AMD kanske släpper på mera om det är Möjligt och nu Nvidia har egen funktion.

Mest avgörande för AMD Radeon är dock 128 MB GPU cache. Det borde fungera för alla CPUer.

Permalänk
Medlem

Om det kan fungera på alla kort så ska de se till att det fungerar på alla kort. Punkt slut.

Med det sagt så är det ändå konstigt att AMD nämner endast RX6000 och NVIDIA bara Ampere. Är det något som jag missat? ¯\_(ツ)_/¯

Permalänk
Medlem

Jag tror nVidia bara är lite avundsjuka

Skrivet av Cocosoft:

SAM innebär väl att CPU:n kan använda grafikkortets minne,vilket är mycket snabbare än vanligt primärminne.
Det jag inte förstår dock är hur det kan vara snabbare... Att gå via PCIe 4.0-bussen etc med extra latens det innebär borde ju vara slöare.

Jag tänker att man kan slippa avståndet mellan CPU och GPU om man till viss del kan lägga större delar i VRAM så kan antingen GPU räkna ut vissa saker som CPU vanligen borde beräkna samt att man även kan skicka saker mellan VRAM och CPU utan att mellanlanda i RAM eller GPU. Ett spel / program med större delen i grafik kan rymmas mer eller mindre i ditt grafikkort och onödigt byte mellan RAM <--> VRAM försvinner framför allt.

Resultatet skulle då bli RAM <-> CPU <-> VRAM. Där CPU bara behöver hantera det minne den vill.

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Skrivet av Thor:

Förtydligandet uppskattas, tack!

Jag är långt(väldigt långt) ifrån att vara en expert.
Det gamla sättet att komma åt grafikminnet var anpassat för 32 bitars system
En 32 bitars adressrymd kan adresssera 4 GB minne.
Denna adressrymd skulle delas mellan grafikkortet och ram, därav kompromissen att ett program(dvs drivrutinen) endast kunde komma åt 256MB åt gången av grafikminnet..
Nu är kompromissen borttagen.
(jag är långt(väldigt långt) ifrån expert så rätta mig gärna)