Extern grafikdocka till stationär dator – vi undersöker prestandatappet

Permalänk
Medlem
Skrivet av Kenneth:

Problemet verkar vara mer på desktop-sidan. När jag provade med en laptop för något år sedan fungerade det mycket bättre. Oklart om det är desktop generellt eller specifikt systemet vi använde (eller fel på mig?)

Jag har testkört med 3DMark "PCI Express feature test" i en Desktop jag har, där då eGPU-boxen med ett 2060S var kopplad med DP till en monitor och dGPU-kortet (Radeon) var kopplat med HDMI till ytterligare en monitor. I HWiNFO64 så framgick det att eGPU arbetade i 2.5GT/s i x4 (alltså i fyra banor), vilket tyder på att kortet jobbar i PCIe 1.1. Detta är väl då något som Microsoft får svara på, varför denna nedväxling sker.

Permalänk
Benchmaskin 🍞
Skrivet av NutCracker:

Jag har testkört med 3DMark "PCI Express feature test" i en Desktop jag har, där då eGPU-boxen med ett 2060S var kopplad med DP till en monitor och dGPU-kortet (Radeon) var kopplat med HDMI till ytterligare en monitor. I HWiNFO64 så framgick det att eGPU arbetade i 2.5GT/s i x4 (alltså i fyra banor), vilket tyder på att kortet jobbar i PCIe 1.1. Detta är väl då något som Microsoft får svara på, varför denna nedväxling sker.

Det är väldigt udda. Vet du om det blir samma i något spel också? Bara för att kolla så det inte blir något knasigt med 3DMark

Permalänk
Medlem
Skrivet av Kenneth:

Det är väldigt udda. Vet du om det blir samma i något spel också? Bara för att kolla så det inte blir något knasigt med 3DMark

Tyvärr (?) är jag ingen gamer, använder den här boxen för att få tillgång till Cuda-kärnor vid rendering, kan därför inte testa den funktionaliteten, men det finns kanske andra som kan haka på. Intressant vore dessutom ifall någon kan testa hur det blir i Linux. Mina datorer med Linux har inte TB.

Permalänk
Medlem
Skrivet av Kenneth:

Det är väldigt udda. Vet du om det blir samma i något spel också? Bara för att kolla så det inte blir något knasigt med 3DMark

Körde en ny test, kunde då konstatera att det inte ör som jag angav tidigare, en nedväxling till PCIe 1.1 (detta gäller när kortet är idle). Så jag har funderat lite ytterligare och kommit fram till följande.

Har man som i testet ett grafikkort vilket jobbar i PCIe 4.0 x16, då kan data maximalt (teoretiskt) färdas i 31.508 GB/s genom en buss som har stöd för dessa specifikationer, men sätter du det kortet i en PCIe 3.0 x4-buss, så kan genomströmningen bli maximalt (teoretiskt) 3.938 GB/s, bara 1/8-del av hastigheten. Mao så är 3DMark PCI Express feature testen inte alls förvånande. När det sen kommer till de övriga testerna kan det nog vara som så, att de skyfflar mycket mer data över bussen än vad 3DMark Firestrike gör, och detta bidrar därmed till betydligt sämre resultat i dessa tester. Det gäller mao att hitta ett optimalt kort för boxen, exempelvis AMDs Radeon RX 6600 XT skulle kunna vara ett tänkbart bra alternativ, det är visserligen ett PCIe 4.0, men dock ett x4-kort. Jag tycker att även mitt val av ett 2060S är hyfsat optimalt. Det kort som användes i testet är ett riktigt dåligt val för en eGPU-box (åtminstone för detta ändamål, uppenbarligen de flesta spel), om man nu inte som jag gör med mitt, använder det för rendering av video, boxen medger att jag kan flytta den funktionen mellan maskiner.

Permalänk
Medlem
Skrivet av NutCracker:

Körde en ny test, kunde då konstatera att det inte ör som jag angav tidigare, en nedväxling till PCIe 1.1 (detta gäller när kortet är idle). Så jag har funderat lite ytterligare och kommit fram till följande.

Har man som i testet ett grafikkort vilket jobbar i PCIe 4.0 x16, då kan data maximalt (teoretiskt) färdas i 31.508 GB/s genom en buss som har stöd för dessa specifikationer, men sätter du det kortet i en PCIe 3.0 x4-buss, så kan genomströmningen bli maximalt (teoretiskt) 3.938 GB/s, bara 1/8-del av hastigheten. Mao så är 3DMark PCI Express feature testen inte alls förvånande. När det sen kommer till de övriga testerna kan det nog vara som så, att de skyfflar mycket mer data över bussen än vad 3DMark Firestrike gör, och detta bidrar därmed till betydligt sämre resultat i dessa tester. Det gäller mao att hitta ett optimalt kort för boxen, exempelvis AMDs Radeon RX 6600 XT skulle kunna vara ett tänkbart bra alternativ, det är visserligen ett PCIe 4.0, men dock ett x4-kort. Jag tycker att även mitt val av ett 2060S är hyfsat optimalt. Det kort som användes i testet är ett riktigt dåligt val för en eGPU-box (åtminstone för detta ändamål, uppenbarligen de flesta spel), om man nu inte som jag gör med mitt, använder det för rendering av video, boxen medger att jag kan flytta den funktionen mellan maskiner.

Läs gärna tråden, han testade med 2060 Super, med liknande resultat

Permalänk
Medlem
Skrivet av medbor:

Läs gärna tråden, han testade med 2060 Super, med liknande resultat

Ja, och det är av samma anledning, x4 för boxen!

Permalänk
Medlem
Skrivet av medbor:

Läs gärna tråden, han testade med 2060 Super, med liknande resultat

Sätter man ett (för) kraftigt kort i boxen, så innebär det endast att det som skall processas sker snabbare, det påverkar inte hur mycket data som kan transporteras. Beroende på olika testers förhållande mellan mängd data som skickas och som processas, så påverkas resultatet. Tänkbar anledning till att Firestrike visar bättre resultat än övriga tester är att det belastar flödet av data i förhållandevis lägre grad.

Permalänk
Medlem

Intressant test.
Även om det skulle visa sig att busshastigheten inte räcker till / är fel, så ger det ändå information. Vilket i sin tur kan leda till en annan inriktning på artikeln. Men om det nu visar sig stämma så är det ju lite skandal. Helt klart är att det är viktigt att kolla om man får den bandbredd som lovats.

Permalänk
99:e percentilen
Skrivet av star-affinity:

The throughput of previous controllers tops out at roughly 23Gbps. The Ice Lake TB3 controller can reach 40Gbps.

Detta är ju extremt intressant. Givet 8b/10b-kodning eller liknande som jag har för mig/antar används i Thunderbolt motsvarar ju 23 Gbit/s just de 2,33 GB/s som @Kenneth konsekvent blev cappad till.

Hade redan svårt att tänka mig att det "bara blev" 2,33 GB/s – exakt 7/12 av de förväntade 4 GB/s – utan anledning, och ovanstående citat stärkte den misstanken. Så jag gissar på antingen någon dylik hårdvarubegränsning eller något knas med konfigurationen (såsom en inställning för "Thunderbolt-läge" eller att någon buss delades med något annat).

Permalänk
Medlem
Skrivet av NutCracker:

Körde en ny test, kunde då konstatera att det inte ör som jag angav tidigare, en nedväxling till PCIe 1.1 (detta gäller när kortet är idle). Så jag har funderat lite ytterligare och kommit fram till följande.

Har man som i testet ett grafikkort vilket jobbar i PCIe 4.0 x16, då kan data maximalt (teoretiskt) färdas i 31.508 GB/s genom en buss som har stöd för dessa specifikationer, men sätter du det kortet i en PCIe 3.0 x4-buss, så kan genomströmningen bli maximalt (teoretiskt) 3.938 GB/s, bara 1/8-del av hastigheten. Mao så är 3DMark PCI Express feature testen inte alls förvånande. När det sen kommer till de övriga testerna kan det nog vara som så, att de skyfflar mycket mer data över bussen än vad 3DMark Firestrike gör, och detta bidrar därmed till betydligt sämre resultat i dessa tester. Det gäller mao att hitta ett optimalt kort för boxen, exempelvis AMDs Radeon RX 6600 XT skulle kunna vara ett tänkbart bra alternativ, det är visserligen ett PCIe 4.0, men dock ett x4-kort. Jag tycker att även mitt val av ett 2060S är hyfsat optimalt. Det kort som användes i testet är ett riktigt dåligt val för en eGPU-box (åtminstone för detta ändamål, uppenbarligen de flesta spel), om man nu inte som jag gör med mitt, använder det för rendering av video, boxen medger att jag kan flytta den funktionen mellan maskiner.

6600XT har PCIe 4.0 x8 och inte x4! (jag tror att du har blandat hop det med 6500xt) och även där kan man se att man tappar prestanda om man kör med PCIe 3.0 x8.
Hardware Unboxed 6600XT PCIe 4.0 x8 vs PCIe 3.0 x8 vilket är ca 5% i snitt och DOOM tappar hela 25%, skulle man halvera bandbredden så tror jag att tappet skulle bli än större.

Sedan lär det knappast hjälpa med att man går via flera kretsar.
Normalt:
CPU -> GPU
Via Thunderbolt:
CPU -> chipset (Z690) -> Thunderbolt 3 Controller -> Thunderbolt till pcie -> GPU
Vilket lär öka latensen samt ta en del av bandbredden pga latensen.

Det kan hända att resultatet är bättre på bärbara datorer efter som jag tror att vissa chipset stöder Thunderbolt direkt men jag kan ha fel.

Men det kan vara "fel" kabel också som ger det dåliga resultatet (finns tydligen ganska många 20Gbit/s Thunderbolt 3 kablar)
och 20Gbps / 8 ~ 2.5Gbyte/s vilket inte är långt i från 2.33Gbyte/s som sweclockers får.

Skulle kanske vara bra om sweclockers kunde testa med exempel PCIe SSD i stället för grafikortet och se vad överförings hastigheten blir för utesluta eventuella fel.

Det är bara en spekulation från min sida =p

Permalänk
Medlem
Skrivet av Knotvillage:

Tycker det är lite fult när dom säljer laptop med ex. 3080, som är strypt till typ 3060. Får dom inte ner temperaturen så bytt kort i dom. Finns säkert många som inte tänker på det utan tror att 3080 alltid levererar som 3080 istället kunde dom sparat några kronor och köpt en laptop med 3060 eller 3060ti.

Kanske går att undervolta med afterburner?

Permalänk
Medlem

Jag har en Asus XG Station Pro med ett GTX 1070 som jag använder för att förvandla en "vanlig" laptop till speldator. Det jag ser är att det är latensen som är problemet. När det blir intensivt i grafiken så tappar jag precision vilket gör att nya krävande FPS spel går bort. Tror inte heller att grafikkortet ger i närheten av sin maximala prestanda när det sitter i dockan, ett inbyggt GTX1050 MaxQ gav lite mer FPS i samma inställningar samt upplevs mycket mer flytande i grafiken.

Det var ett kul koncept oavsett att en å samma laptop kunde vara allt mellan en pekplatta (2-1 dator) till en speldator.

Om Sweclockers vill låna GPU-dockan för ett ytterligare test så är den tillgänglig. Spelar numera på en annan laptop med inbyggt GTX kort.

Permalänk
Medlem
Skrivet av erixon:

Sedan lär det knappast hjälpa med att man går via flera kretsar.
Normalt:
CPU -> GPU
Via Thunderbolt:
CPU -> chipset (Z690) -> Thunderbolt 3 Controller -> Thunderbolt till pcie -> GPU
Vilket lär öka latensen samt ta en del av bandbredden pga latensen.

Det kan hända att resultatet är bättre på bärbara datorer efter som jag tror att vissa chipset stöder Thunderbolt direkt men jag kan ha fel.

Grejen med gen 11 och framåt är ju att dom har TB integrerat i CPUn så latenser etc bör bli bättre. Hade swec använt sig av en modern nuc så kanske resultatet hade sett annorlunda ut? (Sen vet jag inte om det finns nån nuc med plats för nån sorts dgpu...)