AMD: "Fullt stöd för DirectX 12 finns inte"

Permalänk
Medlem
Skrivet av Delerium:

Nvidias kort har inte fullt hårdvarustöd för Directx 12 så enkelt är det. Och det har inte AMDs kort heller. Dock så har AMDs kort stöd för asynkrona shaders vilket har visat sig ha stor inverkan på prestandan i Directx 12-titeln Ashes of the Singularity där Radeon-korten som bekant krossade Nvidias senaste Geforce-modeller i prestandaskalning från Directx 11.

Fast en stor del av prestandaskalningen på AMDs sida var ju för att deras DirectX 11-stöd för titeln sög ordentligt.

Permalänk
Datavetare

@Delerium: visst är det korrekt i sig att AMD skalar betydligt mer från DX11 till DX12, men verkar som många inte riktigt förstår exakt hur uselt AMD-korten presterar med DX11 i Ashes of the Singularity testet.

Tycker du det är rimligt att 960 är snabbare än 390? Det är fallet med "high-preset" när båda korten kör DX11, med "medium" så vinner 960 ännu lite mer.

När man väl kliver över till DX12 ser det ut ungefär som man kan vänta sig i en DX11 titel som "föredrar" AMD GPUer.

Edit: finns en ännu större vansinnighet i DX11, 370 "vinner" över 390 i delen med "Hohe Anzahl an Draw Calls" (stor mängd draw calls) om 370 kör DX12 och 390 DX11 (är inom felmarginalen, så rent praktiskt är det samma prestanda). I det fallet är 960 40% snabbare än 390 om båda kör DX11!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Skrivet av FredrikMH:

Jag syftar till att Sweclockers skriver att AMD rycker ut till Nvidias försvar ("Efter ett smärre angrepp rycker oväntat nog AMD ut till konkurrenten Nvidias försvar"). Det skulle lika gärna kunna tolkas som att de stämplar Nvidias marknadsföringsfras som BS (fast på ett snyggt sätt).

Personligen har jag inte så bra koll på den tekniska aspekten att de nog hade kunnat lura mig med. De som tidigare undrade om man kan få pengar tillbaka kan ju redan nu börja vända er till Konsumentverket. Kanske bilda en grupp först så lär ni få större genomslag om ni sedan hävdar "falsk marknadsföring". Men sen kanske det finns något fint avtal i kartongen eller en text på kartongen vad som egentligen menas med "Full DX12 support". Kanske hävdar Nvidia att alla spel som utvecklas för DX12 kommer att kunna köras på deras grafikkort, för det kommer förmodligen gå.

Skrivet av Ratatosk:

Bra sammafattning, kan inte upprepas nog många gånger.

AMD verkar trots sin tveksamma lansering, faktiskt gå från klarhet till klarhet Hela våren har dom t.ex jobbat hårt med drivers och boostat 200 serien, speciellt tydligt med 290/290x. Lyckas även rätta till felen med free-sync (som CF stöd bra mycket fortare än Nvidia). Overdrive var ett fel från skärmtillverkarna, enda som fattas är bra IPS med 120/144Hz Drivers för fury verkar ju fungera fint.

Nvidi å in sida, gör alla fel, blivit för stora helt enkelt och beter sig där efter. Allt ifrån 970, till nu med DX 12 stödet inte verkar vara nått att skryta om, sen får man inte glömma batman spelet och envist hålla g-sync.

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem

För mig verkar den här soppan bevisa problemet med att "programmera nära metallen" (svengelska) som sker i Dx12 och Mantle. Då måste ju varje speltillverkare hålla reda på exakt vilka begränsningar som finns på alla olika kort.

Visa signatur

Det var enklare förr att skilja Asus moderkort åt:
Asus A7V -> Asus P5Q Pro -> Asus M4A88TD-V EVO/USB3

Permalänk
Medlem
Skrivet av Broken-arrow:

AMD verkar trots sin tveksamma lansering, faktiskt gå från klarhet till klarhet Hela våren har dom t.ex jobbat hårt med drivers och boostat 200 serien, speciellt tydligt med 290/290x. Lyckas även rätta till felen med free-sync (som CF stöd bra mycket fortare än Nvidia). Overdrive var ett fel från skärmtillverkarna, enda som fattas är bra IPS med 120/144Hz Drivers för fury verkar ju fungera fint.

Nvidi å in sida, gör alla fel, blivit för stora helt enkelt och beter sig där efter. Allt ifrån 970, till nu med DX 12 stödet inte verkar vara nått att skryta om, sen får man inte glömma batman spelet och envist hålla g-sync.

Tjena.
Kan bara hålla med till 100%
Tycker det är löjligt med denna sandlåde nivå ( Nvidia vs AMD , räcker det inte med att våra politiker håller på med sånt
Bra skrivet.
Mvh / Mange

Visa signatur

Ryzen 5 3600 @ 4.2 Ghz - Cooler Master Hyper 212 Black Edition
MSI B450M Mortar Max - Corsair Ryzen LPX 32GB 3600MHz / DDR4
Phanteks Eclipse P300 - PNY GeForce RTX 3070 8GB - Seasonic Focus+ / 650W / 80+ Gold
Samsung SSD 850 EVO 500GB - Kingston A400 SSD 480 GB
ACER Predator X34GS - Nobelchair Hero Black Edition

Permalänk
Hjälpsam

@Yoshman Läste vad du skrev igen och nu fastnade kanske lite.
Menar du att även Maxwell fixar alla tre köerna samtidigt men om den har svårt att prioriterara blir inte körningen lika effektiv?

Sjutton vad trög jag är ibland.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

@Yoshman se ovan, @Ratatosk stavade fel

Visa signatur

Räkna ut hur kraftigt nätaggregat du behöver på OuterVision Power Supply Calculator. 500W räcker för de allra flesta vanliga system. Seasonic är bäst. ;) – Elektrostatisk urladdning är ett verkligt problem.
"People who are serious about software should make their own hardware" – Alan Kay
Bojkotta maffian

Permalänk
Hjälpsam
Skrivet av Gibbe:

@Yoshman se ovan, @Ratatosk stavade fel

Tack!

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare
Skrivet av Ratatosk:

@Yoshman Läste vad du skrev igen och nu fastnade kanske lite.
Menar du att även Maxwell fixar alla tre köerna samtidigt men om den har svårt att prioriterara blir inte körningen lika effektiv?

Sjutton vad trög jag är ibland.

Har varit väldigt svårt att hitta exakt vad som gäller, läste lite mer igår kväll och så här förstår jag det nu:

DX12 har tre typer av köer, "direct", "compute" och "copy". "direct" är den mest generella, där kan man posta alla former av jobb och alla dagens DX12 GPUuer har en sådan ("graphic queue"). "compute" kan göra beräkningar och kopieringar (men inte grafik). "copy" kan bara göra förflyttningar av data. Så "direct" är en grundmängd (superset) av "compute" som är en grundmängd av "copy". För att kunna göra allt med DX12 sett ur ett funktionellt perspektiv räcker det en "direct" kö.

Nvidias GPUer sedan Fermi har två lägen, "graphic" där det finns en kö (motsvarande "direct" i dX12) och "compute" där det finns 32 st köer (motsvarande "compute" i DX12). GPUn kan vara i exakt ett av dessa lägen vid varje givet tillfället, tror detta är vad AMD är ute efter när de säger att Nvidia inte stödjer "async compute".

Nu verkar det vara så att Maxwell gen 2 har något som kallas "mixed mode" där alla 32 köer som normalt bara finns i "compute mode" är tillgängliga, men en av köerna agerar "graphics queue". Är här det magiska talet 31 kommer in, det är totalt 32 köer varav en är i DX12 av typen "direct" och de andra 31 blir "compute".

Jämför med GCN1.1/1.2, där finns också en "direct" och 64 st "compute". GCN1.0 har en "direct" och beroende på modell 8 eller 16 "compute".

Så mycket kommer ner till semantik här. Maxwell gen 1 och tidigare har inte vad AMD anser vara "async compute", i termens korrekt bemärkelse och ur ett funktionellt DX12 perspektiv så kan dessa kort både köra "compute" parallellt med grafik. Maxwell gen 2 verkar ha HW-stöd för "async compute" även med definition AMD använder, men finns ju fortfarande möjligheten att

  • HW-stödet inte fungerar, det hade ju inget värde i DX11

  • Nvidias DX12 drivers är trasiga för denna finess just för tillfället

Backar man ett steg så kan man konstatera att "async compute" (i AMDs bemärkelse) fyller ju bara en funktion om det tillför något. För att det ska tillföra något måste det finns outnyttjad kapacitet kvar i GPU-kretsern som bakgrundsberäkningar kan använda utan att det negativt påverkar något annat. För att det ska vara fallet ska man helst ha en svag CPU och en stark GPU, tittar man på resultaten för R7 370 med i7-4790k så får inte ens Ashes of the Singular någon egentlig boost av DX12.

Tittar man på Nvidia har deras GPUer redan mindre outnyttjad kapacitet kvar i DX11, man har en design som är bättre på att utnyttja tillgängliga resurser även om det bara finns en kö att plocka jobb ur. Kanske bara är så att även 970/980 helt enkelt inte har speciellt mycket kapacitet kvar med de CPUer system med dessa GPUer typiskt har, huruvida man stödjer "async compute" eller inte är då irrelevant då prestanda kommer vara densamma. Vinsten skulle vara om man kör 980/980ti med i3 CPU, där skulle nog även Nvidia se en boost med "async compute" (åter igen med AMDs definition av termen, ser inte att DX12 någonsin nämner "async compute").

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam

@Yoshman: " "copy" kan bara göra beräkningar" antar det blev ett copy paste fel där.
Vad jag förstår är det just att kunna använda överbliven kapaciet i GPU:n, som är den stoa nyttan av Async Shaders, om det finns luckor i den den grafiska kön, kan compute slinka i mellan och blir då nästan gratis.

Att GCN har överbliven kapacitet låter inte helt osannolikt.

AMD benämner köerna, graphics, compute och copy.

Citat:
  • Graphics queues for primary rendering tasks.

  • Compute queues for supporting GPU tasks (physics, lighting, post-processig, etc).

  • Copy queues for simple data transfers.

Lite från AMD.
http://amd-dev.wpengine.netdna-cdn.com/wordpress/media/2012/1...

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare

@Ratatosk: såg verkligen ut som ett copy-paste, problemet när jag skriver en viss sak har hjärnan redan börjat fundera på andra saker. D.v.s. att skriva är en asynkron process för mig där det ibland saknas korrekta minnesbarriärer -> data-race

För denna generations konsoler nämndes ju redan från start att CPU-delen är den stora flaskhalsen, att då främst PS4 kan få ganska mycket nytta av ACE är inte så konstigt då dess CPU-del helt enkelt inte orkar mata "command queue" (DX12 direct queue) snabbt nog, är fortfarande så att kommunikation med en viss kö måste endera ske från en och samma CPU-kärna eller på annat sätt vara synkroniserad även i DX12 (HW-krav så kvittar att PS4 kör ett annat API). Den låga enkeltrådprestanda som PS4/XBO har borde därför ändå vara en rejäl flaskhals i vissa lägen.

På PC kommer det nog främst vara toppmodellerna av GCN-korten som ser någon relevant vinst med "async compute", kan framförallt tänka mig att Fury-serien har en de outnyttjad kraft kvar då triangel-kapacitet och pixel/blending-kapcitet inte är högre än lika klockade Hawaii-kretsar. För enklare modeller kommer en vettig CPU kunna mata kretsen mer än väl ändå.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer