Intel Core i9-7980XE "Skylake-X"

Permalänk
Datavetare
Skrivet av HappyPie:

@Yoshman: So TR makes more sense med sin ECC & REG funktioner?
Kanske mer rimligt med 1900X med sina 64 pcie kanaler om behovet baseras mest på GPGPU och mindre på antalet cpu-kärnor, alternativt 1920X/1950X där antalet kärnor också är betydelsefull?
Pengarna kan ju då gå till flera och bättre gpuer än till en dyr cpu.

Vad vore ett rimligt use-case för 64 PCIe-kanaler där du inte har nytta av server-finesser som DDIO (något som saknas på HEDT)?

GPGPU ställer i normalfallet nära noll krav på bandbredden hos PCIe, enda som spelar roll är latensen och den om något är lägre på de mer konsumentinriktade plattformarna.

Det som gör mig avigt inställt till TR är att plattformen har samma logiska begränsningar dual-socket CPU. Vad man får är lite av en benchmark-dragster, d.v.s. en sådan design fungerar lysande på saker som är embarrassingly parallel. "Problemet" sådana saker typexempel på saker en GPU gör bättre än en CPU.

I laster som faktiskt behöver en CPU, faktiskt behöver massiv RAM-bandbredd mot den CPUn, faktiskt behöver massor med kärnor men som inte är embarrassingly parallel så fungerar sällan system med flera NUMA-zoner speciellt väl.

Stars Euler (flödessimulering) är ett fall där HEDT "make sense". Det skalar väl med CPU-kärnor, det kräver massor med bandbredd och det skalar illa till fler sockets så dual-socket servers är inte ett bra val. Orsaken att det skalar illa över sockets är för att det krävs att väldigt mycket data skickas mellan kärnor.

Finns självklart en rad uppgifter där flera NUMA-zoner fungerar hur bra som helst, finns fall där det är en fördel med flera NUMA-zoner då det kan ge bättre skalning. Men här hittar vi nästan helt uteslutande typiska server-laster, saker en "riktigt" server-plattform hanterar bäst.

Kanske missat andra fall som är vettig på HEDT. Mitt problem med hela HEDT-konceptet är just att jag inte ser de vettiga användarfallen. Självklart kommer en HEDT-maskin fungerar fint på skrivbordet, men för varje specifikt fall är i princip alltid i7-8700K alt. en serverplattform (beroende på uppgift) snabbare.

En server behöver inte heller vara jättemycket dyrare, dual Xeon E5-2690v1/2690v2 går att hitta för rätt lite slantar och de är än idag lika snabb eller snabbare (framförallt på I/O-intensiva saker) än allt med möjligt undantag för i9-7940X/7960X/7980XE och även undantaget vetenskapliga applikationer (de kan dels nyttja AVX512 medan dessa Xeon-modellern endast har AVX + dual socket -> två NUMA-zoner).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Överlägset i allt förutom spel, energiförbrukning och pris

Visa signatur

Dator 1: | i9 9900k | MSI RTX 4080 Ventus 3x OC | ASUS ROG STRIX Z390-F Gaming | Corsair LPX DDR4 32 GB 3200Mhz | FD define S | Samsung 850 EVO 1TB | Samsung 980 NVMe M.2 1TB | Noctua NH-U12S | Corsair RM750x 750W | Windows 10
Skärm 1: ASUS 27" ROG SWIFT PG279Q 1440p @ 165Hz/IPS/G-Sync
Skärm 2: ASUS 27" TUF VG27AQ1A 1440p @ 170Hz/IPS/G-Sync/HDR

Permalänk
Master of Overkill
Skrivet av xcluzive:

Överlägset i allt förutom spel, energiförbrukning och pris

Blir så när alla cores jobbar
Polare kör tex i9 7920X och 4 cores i 4.9GHz och 6 cores i 4.8GHz och resten 3.6GHz

Beroende på va han spelar.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Avstängd
Skrivet av Ryzer:

om man köper en CPU for 20k så vill man att den skall vara bäst ur lådan.

Köper man en Apple betalar man för design, användarvänlighet etc. Men bäst per krona? Knappast.
Detsamma gäller ovan, vill man ha en halvbuggig TR så visst köp.

Har man råd med CPUer på 10-20k har man rimligen nån IT ansvarig som kan hantera dom minimala buggarna TR har...

Visa signatur

2600x||16GB @3000Mhz 14-14-10-14-32-46||Vega 64||1TB SSD||HX1000 plat||FD R6 TG vit||CH VII||H100i V2||SST-ARM22SC||SG 32" QHD 144 Hz VA|| https://folding.extremeoverclocking.com/team_summary.php?s=&t...

Permalänk
Avstängd
Skrivet av Ryzer:

om man köper en CPU for 20k så vill man att den skall vara bäst ur lådan.

Köper man en Apple betalar man för design, användarvänlighet etc. Men bäst per krona? Knappast.
Detsamma gäller ovan, vill man ha en halvbuggig TR så visst köp.

Buggig Threadripper?
Inget jag märkt av men antar att jag hade tur då. Är förövrigt väldigt nöjd trots att det är min första AMD sen sist jag hade en FX55 vilket var överlägsen Intels motsvarighet vid den tiden.

Design? Möjligtvis inlåsning samt enkelhet. Design har jag svårt att hålla med om men inbillar man sig det så visst, Kan tycka att andra gör minst lika snygga produkter.

Visa signatur

•·.·´¯`·.·•ЩIЯЦZ•·.·´¯`·.·•
Threadripper 1950X - Aorus x399 Gaming 7 - G.Skill Trident Z RGB 3200Mhz 4x8gb - EVGA GeForce GTX 1080 Ti FTW3 - 500gb Samsung 960 evo - Noctua NH-U14S TR4 - EVGA SuperNOVA G2, 1300W - Acer X34A

Permalänk
Medlem
Skrivet av Yoshman:

Vad gör man primärt som utvecklare? Man skriver specar, läser på om den specifika problemdomänen, man skriver kod (tester och produktionskod), kör man inte ett system från <1995 har man som minimum korrekta beroenden och inkrementella byggen och i många fall kontinuerligt bygge, man kör sina unit-tester etc.

Tror vi pratar förbi varandra, ovan är precis varför jag tycker att en 8700k är meningslös i dessa scenarion. Dvs så länge inte dessa byggen eller unit-tester faktist kräver mer än vad en hallonpaj kan leverera. Dvs perfekt för en surface pro eller till och med en S8 Note.

Däremot om man kör något som kan utnyttja kärnor (make/parallella testsviter) så är återigen en 8700k ett dåligt val i min mening då den helt enkelt har för få kärnor.

För egen del tar jag mycket hellre exempelvis +8 kärnor på 1.8-2.0 GHz, med hyfsad IPC så ARM/RISC går bort, än 2-4 på +4.0 GHz. Av den enkla anledningen att de 8 på lägre kommer köra på lägre volt och frekvens => betydligt effektivare för strömförbrukning. Dvs laptopen funkar fint att köra lite tyngre tester/simuleringar när man inte har möjlighet till uppkoppling mot server. I förbyggande mening så kan ju nämnas att spänningsskalning (i min mening och erfarenhet) är ganska meningslöst under tiden man använder alla kärnorna. Spänningsskalning brukar nämnas av "singel core-entusiaster" iaf. "snigel core"-förespråkare håller inte med.

Permalänk
Medlem
Skrivet av Yoshman:

Vad vore ett rimligt use-case för 64 PCIe-kanaler där du inte har nytta av server-finesser som DDIO (något som saknas på HEDT)?

Vid renderingar där hela eller delar av en scenen får plats i grafikkortets minne och beräkningar görs i "sessioner" eller pass, att data överförs i 1st gång eller färre antal gånger under hela renderingen. Det är ett rimligt och vanligt use-case.

MLT renderare är ett sådant exempel.

Däremot där arbete kräver högt antal i/o operationer framför stor mängd så är det säkert en fördel med DDIO.
Dock läser jag till mig att DDIO är best case eller kanske ett low latency case c:a 10-15% snabbare enbart p.g.a. DDIO. E5 plattformen klarar av som bäst c:a 31GBps (250Gbps) i labbmiljö (hittar bara gamla papper från 2012! så....).

Hursomhelst, som jag förstår det så är det att föredra med direktansluten pcie på cpun än via "sydbryggan" över NIC med DDIO.
Helt enkelt att ha ett multigpu system är att föredra framför flera singlegpu system kopplade över nic via DDIO, för gpgpu-beräkningar som har en viss beroende av låga latenser mellan jobben.

Nu har varken 7980XE eller TR DDIO men TR stödjer RDIMM samt fler antal pcie kanaler direkt till cpu:n, utöver de pcie kanaler som går till moderkortet, än 7980XE.
Så i sin helhet att kunna ha flera gpuer via pcie direkt kopplat till cpu:n samt med RDIMM för att ha relativt stor mängd RAM till relativt låga latenser och i samband med stabilitet i ett systemet med ECC och REG ger TR en fördel. (REG ger även lägre latenser när fler stickor används?).
Då räcker säkert en 1900X, men om arbetet skalar bra och utnyttjar även cpu:er eller har en tumregel på att vara optimerad till 1 dedikerad kärna per gpu så kan 1920X eller 1950X vara bra vid flera gpuer.

Där 7980XE har sin nisch så slår antingen 1950X på funktioner och ev. prestanda eller alternativt någon av varianterna av Epyc singel 24/48, 32/64 eller dual 16/32, 24/48, 32/64 till samma pris som ett 7980XE.
För övrigt att 7980XE är en "konsument" cpu struntar jag i som argument om priset är högre än AMDs "server" cpu, pris per system gällande prestanda och funktioner är vad som är betydelsefullt
Ett Epyc system verkar vara mer intressant än Xeons variant i samma visa som mellan TR och 7980XE, även om man kan köra med DDIO med Xeon E5:or.

Jag utgår som sagt att DDIO är en funktion för kommunikation mellan flera datorer bl.a. via NIC(?) ....och att ha en dator med cpu med flera pcie kanaler är att föredra framför det, så att en dator kan innehålla så många gpu:er som möjligt i latenskänsliga beräkningar.
Är det cpu-beräkningar så tänker jag att en single Epyc 32/64 eller dual 24/48, 32/64 om det är nödvändigt med ännu flera cpu-kärnor, i latenskänsliga beräkningar som skalar bra på antalet kärnor, till samma pris som en 7980XE eller Xeon.

Om det är IPC och klock som är viktigast och jobbet är cpu-baserad samt kan delas upp över nätverket relativt oberoende av varandra latensmässigt så är flera i7 8000 att föredra, vilket vissa renderingsjobb är anpassade för.

Permalänk
Medlem
Skrivet av Yoshman:

Stars Euler (flödessimulering) är ett fall där HEDT "make sense". Det skalar väl med CPU-kärnor, det kräver massor med bandbredd och det skalar illa till fler sockets så dual-socket servers är inte ett bra val. Orsaken att det skalar illa över sockets är för att det krävs att väldigt mycket data skickas mellan kärnor.
http://techreport.com/r.x/2017_09_27_Intel_s_Core_i9_7980XE_and_Core_i9_7960X_CPUs_reviewed/euler3D.png

Läs på http://www.caselab.okstate.edu/research/euler3dbenchmark.html

"Intel's Fortran Compiler generates different code paths for different processor capabilities. Non-Intel processors may not trigger the fast code path (See more information). Yes, we are aware of this issue. Yes, it is quite annoying that Intel's compilers behave this way. According to an anonymous contributor, the difference on a modern AMD processor is about 10%. We actually expected the difference to be significantly greater! We are also aware of several fixes but have not applied them as of yet."

Det är en både meningslös och missvisande benchmark att hänvisa till. Den visar inget om HEDT.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem

Det hade varit extremt intressant att se benchmark på Cryptonight. Antar att den bör ligga en bit över t.ex. ett GTX 1080ti vilket blir ganska bra profit.

Här kan man se benchmarks på både GPU och CPU. Väldigt beroende av Cachestorlek.

Länk
Permalänk
Medlem
Skrivet av Ryzer:

Älskar att folk klagar på priset. Ni ska veta vad företag betalar för licenser varje år.. 20k för en processor är som piss i havet i jämförelse.

Företag må ha pengar men dom är inte dumma. det höga priset måste ge en relevant fördel som går att räkna hem.

Visa signatur

Moderkort: MSI MPG X570 Gaming plus CPU: Ryzen 7 5700X3D
RAM: Crucial Ballistix 16GB DDR4 3600 MHz Kylning: Noctua NH-D15 chromax.black Lagring: 4 x Samsung 840 Pro 500GB
Grafikkort :Sapphire Radeon™ RX 6950 XT PURE NITRO+ Nätaggregat: EVGA SuperNOVA 750 G2
Chassi: Fractal Design Define Vision S2 Blackout Monitor: HP OMEN 27 & Acer XF270HUC
Tangentbord: Corsair Gaming Strafe RGB MX SILENT Mus: SteelSeries Rival 700

Permalänk
Master of Overkill
Skrivet av robbankentor:

Företag må ha pengar men dom är inte dumma. det höga priset måste ge en relevant fördel som går att räkna hem.

Ja hårdvara är oftast betalt inom 30 dagar och används i 5 år så rätt enkelt räkna hem

Skickades från m.sweclockers.com

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Medlem

Hahahah

*Köper en processor för 20 000:-*

*Klarar inte att spela Warhammer i 1080p i 60 fps.*

*Go home*

Visa signatur

9900k | Z390 AORUS MASTER | 32GB RAM | AORUS GeForce RTX 2080 SUPER WATERFORCE 8G | XFX Black 1250W | BeQuiet Pure Base 500 | Fractal Design Celsius S36 | Samsung 970 500GB + Corsair MP510 960GB | Dell U3415W | Windows 11 Professional

Permalänk
Medlem
Skrivet av tvelander:

Ja hårdvara är oftast betalt inom 30 dagar och används i 5 år så rätt enkelt räkna hem

Skickades från m.sweclockers.com

Märkligt. Jag jobbar som konsult och är ute på företag dagligen.
Har aldrig stött på ett företag som slösar bort sina pengar

Visa signatur

Lightsaber - Black armour - and balls!

Permalänk
Medlem

Jag tror världsrekordet i överklockning just nu ligger på en 7980XE va? Såg nån YT video för ett tag sen

Visa signatur
Permalänk
Medlem
Skrivet av robbankentor:

Företag må ha pengar men dom är inte dumma. det höga priset måste ge en relevant fördel som går att räkna hem.

Grejen är att processorn är ämnad för konsumenter och inte företag, exakt vilka som har behov av tingesten och är villiga att pynta 20k är vad som diskuteras. Även om en och annan nämnt spelande så är den definitivt inte bästa valet, det är som att köpa en stor skåpbil för att åka bort och handla kvällsmaten, att spela med en Xeon Platinum processor är typ shoppa med långtradare, visst går det men finns bättre alternativ.

Skickades från m.sweclockers.com

Visa signatur

CPU: Intel i9-12900K Cooler: Asus TUF Gaming LC 240 ARGB MB: Asus TUF Gaming Z690 Plus Wifi D4 GPU: Asus TUF GeForce RTX 3080 Ti 12GB Case: In Win D-Frame HD: Intel Optane 900P 280GB, WD Black SN850 1TB Mem: Kingston Fury Beast RGB 3600MHz CL17 32GB PSU: Corsair AX760 OS: Win11 Pro

Permalänk

CPUn har ingen klar målgrupp. Intel vill bara ta prestandakronan och har inte för avsikt att sälja mycket av den. Den saknar ECC och är dyr för vad du får.

Epyc är ett mycket bättre val om du har de där pengarna. Du får 128 PCIe kanaler, ECC, krypterad virtualisering och annat gott:
-Om du lägger till 6.000 kr (dvs 26.000kr) så får du en 32-core Epyc 7551p som springer åttor runt denna i tunga multitrådade laster.

-Om du vill spara 6.000kr (dvs 14.000kr) så får du en 24-core Epyc 7401p som också är snabbare i multitrådade laster.

-Du får två stycken 16-core Epyc 7351p för samma pris, som också är snabbare. Så jag fattar inte riktigt poängen med denna cpu. Verkar helt menlös? Vad sysslar Intel med?

Permalänk
Benchmaskin 🍞
Skrivet av sAAb:

@Kenneth, trevlig artikel! Tack!

Men, det står "Medelvärde" och "Lägsta värde" utan beskrivning hur dessa beräknats.

Medelvärde är väl aritmetiskt medelvärde förmodar jag.

Jag hoppas verkligen inte att "Lägsta värde" är lägsta värde utan är 99:e percentilen. Hur har "Lägsta värde" bestämts?

Lägsta värdet för CPU-tester just nu är lägsta värdet i vanlig FRAPS-anda. Vi har inte gjort övergången till OCAT för CPU-sviten ännu, men kommer göra när det är dags att göra om den igen.

Permalänk
Datavetare
Skrivet av andda715:

Tror vi pratar förbi varandra, ovan är precis varför jag tycker att en 8700k är meningslös i dessa scenarion. Dvs så länge inte dessa byggen eller unit-tester faktist kräver mer än vad en hallonpaj kan leverera. Dvs perfekt för en surface pro eller till och med en S8 Note.

Däremot om man kör något som kan utnyttja kärnor (make/parallella testsviter) så är återigen en 8700k ett dåligt val i min mening då den helt enkelt har för få kärnor.

För egen del tar jag mycket hellre exempelvis +8 kärnor på 1.8-2.0 GHz, med hyfsad IPC så ARM/RISC går bort, än 2-4 på +4.0 GHz. Av den enkla anledningen att de 8 på lägre kommer köra på lägre volt och frekvens => betydligt effektivare för strömförbrukning. Dvs laptopen funkar fint att köra lite tyngre tester/simuleringar när man inte har möjlighet till uppkoppling mot server. I förbyggande mening så kan ju nämnas att spänningsskalning (i min mening och erfarenhet) är ganska meningslöst under tiden man använder alla kärnorna. Spänningsskalning brukar nämnas av "singel core-entusiaster" iaf. "snigel core"-förespråkare håller inte med.

Tror inte vi pratar förbi varandra. Är fullt medveten om att i7-8700K sex kärnor inte ger speciellt mycket vinst i de flesta typiska uppgifter en utvecklare företar sig.

Ta skriva-kod/bygga/köra-test cykeln, finns absolut fall där inget av stegen tar någon relevant CPU-kraft. Sitter man på stora projekt, framförallt sådana som använder mycket templates i C++, så vill man inte ha en RPi3 då "bygga" steget mycket väl kan ta 10-20 s, det för en enda fil. Enda som spelar roll då är enkeltrådprestanda, är ju tiden att kompilera en fil man vill slippa vänta på. (Ovanpå det tar länksteget i ett stort projekt mer RAM än vad RPi3 har, så fungerar inte av den anledningen heller).

i7-8700K är "bäst" för att den har högst enkeltrådprestanda. I praktiken sitter ändå allt fler på bärbara, här finns två stora orsaker till det idag fungerar så bra

  • flera moment är I/O-intensiva, många små transaktioner. Bärbara sög på detta tidigare då mekaniska 2,5" diskar var klart långsammare än 3,5" för stationära. Idag är finns ingen relevant skillnad i diskhastighet mellan bärbara och stationär tack vare SSD

  • 15 W TDP laptops finns idag med boost till och med strax över 4,0 GHz. De kan hålla denna frekvens tillräckligt länge för att överleva koda/kompilera/testa cykeln -> som om man satt på en stationär med 4,0 GHz CPU

Skrivet av HappyPie:

Vid renderingar där hela eller delar av en scenen får plats i grafikkortets minne och beräkningar görs i "sessioner" eller pass, att data överförs i 1st gång eller färre antal gånger under hela renderingen. Det är ett rimligt och vanligt use-case.

MLT renderare är ett sådant exempel.

Däremot där arbete kräver högt antal i/o operationer framför stor mängd så är det säkert en fördel med DDIO.
Dock läser jag till mig att DDIO är best case eller kanske ett low latency case c:a 10-15% snabbare enbart p.g.a. DDIO. E5 plattformen klarar av som bäst c:a 31GBps (250Gbps) i labbmiljö (hittar bara gamla papper från 2012! så....).

Hursomhelst, som jag förstår det så är det att föredra med direktansluten pcie på cpun än via "sydbryggan" över NIC med DDIO.
Helt enkelt att ha ett multigpu system är att föredra framför flera singlegpu system kopplade över nic via DDIO, för gpgpu-beräkningar som har en viss beroende av låga latenser mellan jobben.

Nu har varken 7980XE eller TR DDIO men TR stödjer RDIMM samt fler antal pcie kanaler direkt till cpu:n, utöver de pcie kanaler som går till moderkortet, än 7980XE.
Så i sin helhet att kunna ha flera gpuer via pcie direkt kopplat till cpu:n samt med RDIMM för att ha relativt stor mängd RAM till relativt låga latenser och i samband med stabilitet i ett systemet med ECC och REG ger TR en fördel. (REG ger även lägre latenser när fler stickor används?).
Då räcker säkert en 1900X, men om arbetet skalar bra och utnyttjar även cpu:er eller har en tumregel på att vara optimerad till 1 dedikerad kärna per gpu så kan 1920X eller 1950X vara bra vid flera gpuer.

Där 7980XE har sin nisch så slår antingen 1950X på funktioner och ev. prestanda eller alternativt någon av varianterna av Epyc singel 24/48, 32/64 eller dual 16/32, 24/48, 32/64 till samma pris som ett 7980XE.
För övrigt att 7980XE är en "konsument" cpu struntar jag i som argument om priset är högre än AMDs "server" cpu, pris per system gällande prestanda och funktioner är vad som är betydelsefullt
Ett Epyc system verkar vara mer intressant än Xeons variant i samma visa som mellan TR och 7980XE, även om man kan köra med DDIO med Xeon E5:or.

Jag utgår som sagt att DDIO är en funktion för kommunikation mellan flera datorer bl.a. via NIC(?) ....och att ha en dator med cpu med flera pcie kanaler är att föredra framför det, så att en dator kan innehålla så många gpu:er som möjligt i latenskänsliga beräkningar.
Är det cpu-beräkningar så tänker jag att en single Epyc 32/64 eller dual 24/48, 32/64 om det är nödvändigt med ännu flera cpu-kärnor, i latenskänsliga beräkningar som skalar bra på antalet kärnor, till samma pris som en 7980XE eller Xeon.

Om det är IPC och klock som är viktigast och jobbet är cpu-baserad samt kan delas upp över nätverket relativt oberoende av varandra latensmässigt så är flera i7 8000 att föredra, vilket vissa renderingsjobb är anpassade för.

Tiden att överföra data kontra tiden att utföra beräkning gör att dataöverföringen blir irrelevant. GPUn kommer signalera att jobbet är klart, data kan sedan DMAs ner från kortet samtidigt som nästa jobb laddas upp. Ofta är indata i ett sådant jobb långt mindre än utdata (bilden) + PCIe är en enkelriktad buss så upp- och nedladdning påverkar inte varandras kapacitet (separata kanaler).

Se på mining-riggarna. De specialdesignade moderkorten är tapetserade med PCIe x1 portar för att få in så många GPUer per CPU som möjligt.

DDIO är en funktion som gör det möjligt att köra DMA till/från CPU-cache. Effekten blir därför noll om man enbart gör bulktransfer via DMA. Tekniken nämns främst ihop med NICs, men den är väldigt effektivt på alla former av I/O där man gör väldigt många I/O-transaktioner per tidsenhet.

Vid introduktion av DDIO, Sandy Bridge, var det kanske bara 10/40 Gbit/s Ethernet som riktigt kom upp i problematiskt höga I/O frekvenser. Idag når SSDer och än mer Optane väl in i regionen av miljoner I/O-transaktioner per sekund, i alla fall totalt över systemet.

Var ett par år sedan jag sist jobbade med den här typen av problem. Har sett fall där DDIO gav klart över 50 % boost, detta i ett system som hanterade väldigt mycket I/O per tidsenhet.

Ett typfall för CPUn var att en transaktion kom in, den skulle klassificeras (av CPUn, så CPUn behöver inkommande data från t.ex. NIC och relevant tillstånd för att utföra klassificeringen från någon form av databas som låg lokalt på disk). Klassificeringen kanske resulterade i att data först måste dekrypteras, något som endera gjordes på CPU men ibland på kryptoaccelerator (PCIe-baserad accelerator).

Huruvida det finns en flaskhals vid 250Gbps låter jag vara osagt, det fungerade i alla fall att köra 8 st 10 Gbit/s NICs + lite kryptoacceleratorer och ett gäng diskar (allt jämt fördelat över sockets/NUMA-zoner) från dual-socket E5 2690v1 och framåt. En av huvudpoängerna med Skylake SP är ju att rejält bumpa intern I/O-kapacitet, så gränsen ligger rimligen långt högre idag (har varit mycket ARM och sådan på senare tid, inte så mycket Xeons...).

Rent generellt: DDIO hjälper i fall där periferienhet<->CPU latens är flaskhals.

Intels konsument-CPUer med eDRAM ger sedan Skylake en "fattigmans DDIO". Sedan Skylake sitter eDRAM inte som L4$ till CPU utan som en "osynlig" RAM-buffer, d.v.s. på RAM-sidan av RAM-kontroller. Det betyder att alla DMA-transaktioner också går via eDRAM -> går att köra DMA till/från eDRAM. Blir inte alls samma boost som DDIO då eDRAM har betydligt högre latens jämfört med CPU cache, men man kan få 10-20 % boost mot sin NVMe disk vid små transaktioner/långt ködjup.

TR stödjer ECC+RDIMM, dock saknas väl ändå sådant stöd på de "konsumentanpassade" moderkorten? För mig är TR inte riktigt en konkurrent till Intels HEDT plattform, det är en konkurrent till Xeon Silver/Bronze. Varför?

  • Intels HEDT plattform är ett vettig val i lägen som inte skalar väl över NUMA-zoner, saker som skalar är ofta mer kostnadseffektiva att köra på TR eller Xeon Silver/Bronze. TR är ur denna aspekt identiskt med dual-socket maskiner, inte med en monolitiskt Intel HEDT

  • Behöver man riktigt många PCIe men inte superkraft i CPUn så ger faktiskt två Xeon Bronze (som finns från ~$200 styck) totalt 96 PCIe linor till CPU, ovanpå det tillkommer de från sydbryggan, svårt att se något annat kunna konkurrera med det prismässigt

  • Xeon Silver/Bronze ger en plattform med officiellt ECC och RDIMM stöd + maximal RAM-kapacitet är 1,5 TB (768 GB per socket) vilket vida överstiger HEDT-plattformen

Skrivet av sAAb:

Läs på http://www.caselab.okstate.edu/research/euler3dbenchmark.html

"Intel's Fortran Compiler generates different code paths for different processor capabilities. Non-Intel processors may not trigger the fast code path (See more information). Yes, we are aware of this issue. Yes, it is quite annoying that Intel's compilers behave this way. According to an anonymous contributor, the difference on a modern AMD processor is about 10%. We actually expected the difference to be significantly greater! We are also aware of several fixes but have not applied them as of yet."

Det är en både meningslös och missvisande benchmark att hänvisa till. Den visar inget om HEDT.

Det har definitivt något med Intels HEDT att göra. Detta problem skalar inte väl över NUMA, det gäller även på Intel så har inget med kompilatorn att göra. Detta problem skalar lysande med väldigt hög minnesbandbredd (vilket är väldigt ovanligt, får program har någon större skalning med minnesbandbredd), det även på Intel så har inget med kompilator att göra.

Och om nu skillnaden för AMD är 10 %, det är långt mer som skiljer här relativt hur det ser ut i andra fall.

Infinity Fabric nämns väldigt ofta som något revolutionerande, men det är egentligen inget nytt

  • IF ett protokoll, inte en elektrisk specifikation (det är en evolution av HyperTransport)

  • Är specifikt i fall där det knappt finns någon större mängd kommunikation mellan kärnor där TR står sig riktigt väl mot Intels HEDT, d.v.s. där IF knappt används (multi-socket system skalar också lysande i motsvarande fall)

  • Finns det ingen relevant skillnad mellan IF och protokoll i andra intersocket länkar, Intel har faktiskt lägre latens och högre bandbredd mellan sockets i Skylake SP än vad Epyc har mellan sina CPU-kärnor som ligger på samma kapsel (något som knappast beror på de olika protokollen utan på hur länken realiserats i kisel, UltraPath Connect har väldigt hög frekvens (4,8-5,2 GHz beroende på SKU) -> låg latens)

Benchmarken må ha brister, vilket tyvärr gäller de flesta benchmarks.

Men varför klagar så få på Cinebench i så fall? Cinebench använder en instruktionsmix som inte är relevant för något designat de senaste 10-15 åren. Cinebench har ett "working-set" som helt får plats i lokal cache, så det är helt okänsligt för saker som RAM bandbredd/latens och det skalar därför orealistiskt. Euler 3D är ingen supermåttstock för generell prestanda, men Cinebench är i väldigt många fall en ännu sämre måttstock på det.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Min största fråga är: vem är HEDT riktad mot?

Ta detta från sammanfattning t.ex.

"För applikationer inriktade mot produktivitet är Core i9-7980XE en riktigt kompetent modell."

Det har aldrig varit sant för "produktivitet" i form av t.ex. programmering. Visst är många kärnor vettigt för en byggserver, men det är en "server" och körs lämpligen på sådant. För typiskt daglig utveckling regerar hög enkeltrådprestanda, d.v.s. koda-bygg-testa-repetera (många miljöer bygger i bakgrunden så byggtiden är praktiskt sett noll).

Det var sant fram till hyfsat nyligen för områden som rendering och filmredigering, men båda dessa områden hantera idag mer effektivt via GPGPU. En G4560 + GTX1070 lär dra jämnt med 7980XE i Blender t.ex...

Adobe har gjort en storsatsning kring att GPGPU optimera sina produkter. En effekt är att Puget Systems, ett företag som specialiserats sig på arbetsstationer, ändrat sina rekommendationer för video-editering. Det från att rekommendera Xeon-servers med väldigt många kärnor till att nu rekommendera i7-8700K + fet GPU. Anledningen till just i7-8700 (och tidigare i7-7700K) är att i huvudsak två: GPGPU-optimerade applikation kommer fortfarande ha saker som är relativt sekventiella, så man vill ha maximal enkeltrådprestanda. Vidare får man ut lite mer av sitt beräkningskort om man minimerar tiden den väntar på nytt jobb, latensen minimeras bäst med en CPU som har högsta möjliga enkeltrådprestanda.

Detta är vad Puget System skriver in sina rekommendationer, tänk på att detta kommer från ett företag som rent krasst tjänar mer om kunden valde en dyrare Xeon...

"Q: You only list Core i7 CPUs, don't I need a Xeon CPU?

A: In the past, Xeon CPUs were more robust than their Core i# counterparts. Today, however, there is very little functional difference between the two Intel product families for workstations. In addition, Xeon CPUs are almost always clocked slightly lower than the Core i7 CPUs which means that you will be giving up a small amount of performance to gain a set of features that are typically only useful for servers."
[...]

Mjo men 6 kärnor kanske fungerar för Adobe, men sitter du i postproduktion så kommer du sannolikt inte begränsa dig till att bara deras paket av mjukvara. Resolve, medans det skalar riktigt bra med GPU-kraft, matas fortfarande mha CPU och 6 kärnor räcker generellt inte för att ett Titan X inte ska få en del idle tid (beror rätt mycket på hur man byggt upp sin korr, men generellt är det för lite) . Avid Media Composer skalar sisådär med kärnor öht (och GPGPU är undermålig), men även där hittar vi renderingsscenarion som drar nytta av mer än 6 kärnor.

Med i9:orna ligger också lite charm med Turbo 3.0 och som du säger bra singeltrådsprestanda. Också en bitter verklighet att så många typiska populära post-plugins bara nyttjar ett fåtal kärnor. Kan att ha att göra med APIerna de får skriva plug-ins med, inte säker. Hur som så är det trevligt när ett par kärnor snurrar upp ovanför 4GHz.

Vi köpte in tre stycken system med 7920X för digtial färgkorrigering och effektläggning till jobbet, och de har fungerat klockrent och sopat mattan med förra generationens Xeons i våra HP workstations Så pass bra att jag köpte en till hemmaburken också.

Visa signatur

i9-10980XE ~4.6GHz | 128GB DDR4-3600 | ASUS WS X299 PRO | RTX 4070 Super, Founders Edition
i7-7820X 4.8GHz | 64GB DDR4-3200 | ASUS WS X299 PRO | RTX 3080, Founders Edition

Permalänk
Medlem
Skrivet av WoG:

Hahahah

*Köper en processor för 20 000:-*

*Klarar inte att spela Warhammer i 1080p i 60 fps.*
https://cdn.sweclockers.com/artikel/diagram/14477?key=d5b3d8a0cb7a6085702beedd56896553

*Go home*

Och både TR samt 7980XE får då stryk av en sketen i3a för en bråkdel av priset i det där testet, snälla det säger ingenting.
Du kommer aldrig kunna köpa en processor som är bäst på allt även om den kostar 20000.. Är det just Warhammer som bekymmrar dig så är nog varken en TR eller en 7980XE processorn för dig i vilket fall😉

7980XE är mer riktat till entusiaster än mainstream såklart, precis som Tvelander skrev så går det alltid att optimera över färre cores och resultatet blir annorlunda vilket dom flesta som köper dessa processorer inte ser som ett problem.
Ska man ha nånting som fungerar direkt ur lådan så får man nog nöja sig med en färdig dator från valfri butik.

Skickades från m.sweclockers.com

Permalänk
Master of Overkill
Skrivet av kempa:

Och både TR samt 7980XE får då stryk av en sketen i3a för en bråkdel av priset i det där testet, snälla det säger ingenting.
Du kommer aldrig kunna köpa en processor som är bäst på allt även om den kostar 20000.. Är det just Warhammer som bekymmrar dig så är nog varken en TR eller en 7980XE processorn för dig i vilket fall😉

7980XE är mer riktat till entusiaster än mainstream såklart, precis som Tvelander skrev så går det alltid att optimera över färre cores och resultatet blir annorlunda vilket dom flesta som köper dessa processorer inte ser som ett problem.
Ska man ha nånting som fungerar direkt ur lådan så får man nog nöja sig med en färdig dator från valfri butik.

Skickades från m.sweclockers.com

Ja för kör man 36 trådar i warhammer är man nog inte den person som ska äga en 7980X för då gråter jag lite om man inte orkar ändra en config fil från 18 cores till 4-6 cores tar seriöst 5 sekunder.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Master of Overkill
Skrivet av kotz:

Företag 1: majoriteten av användarna har laptops som sina arbetsdatorer. Ofta är det Lenovo och har då ett par år på nacken.
Företag 2. majoriteten av användarna har laptops som sina arbetsdatorer. Ofta är det HP som märke och då har de ett par år på nacken.
Företag 3. majoriteten av användarna har laptops som sina arbetsdatorer. Nu repeteras märket mellan Lenovo och HP. Dyker upp en anna ensam stackare lite då och då.
Företag 4. majoriteten av användarna har laptops som sina arbetsdatorer. Här finns det användare som har lite fetare laptops, men fortfarande väldigt få stationära.
Företag 5 - x ser likadant ut när det gäller vad för datorer de använder. Någon använder sig av stationär men de blir färre och färre. Ibland dyker det upp Mac som används av designers.

Väldigt sällan är det stationära datorer som används då laptops kan man ta med sig hem.
Sitter användarna med feta nya datorer? NEJ

Märker att du inte jobbar inom high-end segment av hårdvara.
Och vore väldigt intressant veta vad dessa företag gör som du hjälper med hårdvara.

Om du säger flesta har laptops.

Stationära köps så det brinner på dom jag har kontakter med och det används flitigt.

"Väldigt sällan är det stationära datorer som används då laptops kan man ta med sig hem."

Nope, dom har båda.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Medlem

Jag tror detta mer handlar om att visa vem som kan leverera världens snabbaste desktop-CPU än om vem som egentligen behöver den eller vad den kostar. Intel ville väl visa att de fortfarande "kan bättre" än AMD. Det är bra marknadsföring att vara överst i staplarna i recensionerna. Kommer säkert finnas köpare som vill ha det bästa som kan får för pengar oavsett om det är för att de behöver det eller om de bara vill kunna skryta.

Permalänk
Medlem
Skrivet av robbankentor:

Företag må ha pengar men dom är inte dumma. det höga priset måste ge en relevant fördel som går att räkna hem.

Företag köper Xeon-baserade system som är avsedda för företagskunder. HEDT är en skrytplatform för konsumenter.

Visa signatur

Ryzen 7 3800X, Asus Prime X370 Pro, 32 GB LPX 3600, Gainward RTX 3060 Ti Ghost, 7 TB SSD + 4 TB HDD

Permalänk
Medlem

Hahah, snarlik prestanda mot threadripper 1950X som kostar i princip hälften så mycket.

GO AMD!

Visa signatur

Ducati Streetfighter 848, -2013
Yamaha FZR 1000, -1987

Permalänk
Medlem
Skrivet av tvelander:

Märker att du inte jobbar inom high-end segment av hårdvara.
Och vore väldigt intressant veta vad dessa företag gör som du hjälper med hårdvara.

Om du säger flesta har laptops.

Stationära köps så det brinner på dom jag har kontakter med och det används flitigt.

"Väldigt sällan är det stationära datorer som används då laptops kan man ta med sig hem."

Nope, dom har båda.

Kommuner med ett par tusen användare till produktions företag med 20 användare.
De handlar ofta mycket på en gång. Mer pengar där ^^
Sen ligger deras fokus på säkerhet och inte individuella användare. Dvs de lägger krutet på zäkerhet och flexibilitet.

Visa signatur

Lightsaber - Black armour - and balls!

Permalänk
Master of Overkill
Skrivet av kotz:

Kommuner med ett par tusen användare till produktions företag med 20 användare.
De handlar ofta mycket på en gång. Mer pengar där ^^
Sen ligger deras fokus på säkerhet och inte individuella användare. Dvs de lägger krutet på zäkerhet och flexibilitet.

Kommuner ........
Ja där finns det noll pengar.

Vi lägger krutet på allt, prestanda, säkerhet, flexibilitet med workstation + laptop med VPN + remote GPUs så man kan jobba vart man vill i världen och ha prestanda av en 50k maskin när som helst och dokumenten lämnar aldrig servern.

Och detta kör 50 pers , sen finns ju renderingsfarmar och workstations för över 300k styck.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Moderator
Testpilot
Skrivet av tvelander:

"m man köper en CPU for 20k så vill man att den skall vara bäst ur lådan."

Roligaste jag hört på länge, det KOMMER aldrig funka så.
Jag sitter fan configar mina spel för olika cores på en 8700k, gör jag inte det på min gamla 5960X i tex CS:GO får jag total skit fps samma med WoW, LoL Dota 2 och massa andra spel.

Så lägg ner tramset ska funka ur boxen...
Man configar spelet för så många cores man vill använda det tar 10 sec ändra i config filen.

Men visst kör du 18 core 36 trådar CS:GO Tex och få fps drops på över 200.

Jag tror det finns ganska många konsumenter som förutsätter att produkten fungerar optimalt direkt ur lådan. Vi är en grupp nördar här på detta forumet som mer än gärna tweaker och pressar våran hårdvara till max men att påstå att man inte ska kunna förutsätta att en produkt fungerar optimalt direkt ur lådan är en märklig ståndpunkt enl. min åsikt.

Visa signatur

ASrock x470 Taichi Ultimate - AMD Ryzen R9 3900x - G.Skill Ripjaws@3.6GHz 16GB RAM - RTX 3080 Ti - Super Flower Leadex Gold 1000W - Phanteks Enthoo Pro - AOC AG35UCG 34" 3440x1440p@100Hz - kalaset vattenkylt

Permalänk
Skrivet av tvelander:

Nä företag köper inte rimligtpris CPUr haha, hårdvara är liksom det billigaste i allt.
Man köper så dyrt man kan och öser på.
Ingen köper en 18 core CPU för 20k från X299 när det finns Xeon till företag, när licens för program ligger på över 100k per användare.
Och då snackar vi 1 program.
Du är uppe tex vissa företag 500k + för en person i licens, då är hårdvara piss i Mississippi

Dock en generalisering. Inte så att exakt alla företag sitter på samma licenser.

Däremot så är det värt att påpeka att X299 och i7or samt i9or inte är för företag på det sättet, mer riktat åt konsumenter och multimedia amatörer.

Visa signatur

PC #1 CPU: R5 1600 @3.8 Motherboard: B350-A PRIME GPU: EVGA 1080 Ti
PC #2 CPU: i7 3770K @4.2 Motherboard: P8P67 GPU: AMD R9 290X

Permalänk
Master of Overkill
Skrivet av Dinoman:

Jag tror det finns ganska många konsumenter som förutsätter att produkten fungerar optimalt direkt ur lådan. Vi är en grupp nördar här på detta forumet som mer än gärna tweaker och pressar våran hårdvara till max men att påstå att man inte ska kunna förutsätta att en produkt fungerar optimalt direkt ur lådan är en märklig ståndpunkt enl. min åsikt.

För inga vanliga konsumenter lägger 10k på en CPU.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240