AMD möter upp Intels 28 kärnor med Ryzen Threadripper 2 – 32 kärnor på 250 W

Permalänk
Medlem
Skrivet av anon200632:

Snart är Amd nere på 1GHZ per kärna om de fortsätter så här.

Fy skäms.

Va?

Säger bara Intel Xeon 28 kärnor på 2,1 GHz... Fy skäms.

https://ark.intel.com/products/120508/Intel-Xeon-Platinum-817...

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Ryzer:

Det är ju en fruktansvärt dålig jämförelse. Du kan inte jämföra en ''mjuk'' spelupplevelse utan lagg och att behöva vänta några sekunder extra på någon beräkning. Visst tid är pengar, men en väldigt liten skara använder deskopdatorer för tunga uträkningar etc.

Hade du spelat i 50 fps dagligen, eller väntat 10 sec extra på beräkningar?

Fast vi snackar ju inte +/-10 sekunder... Under mitt masterarbete körde jag ett par simuleringar som tog en vecka.. Och det var med dubbla 6-kärniga intel cpuer. Jämför vi då intels 4/6-kärniga i7or och TR med 32 kärnor, då snackar vi i runda slängar en månad extra för de 4/6-kärniga...

Du får inse att behoven för olika typer av datorer varierar enormt. En 32-kärning cpu är rena drömmen får någon som sitter och jobbar med lite mer komplexa simuleringar och andra tunga beräkningar. Jag har inte heller superbra koll på alla användingsområden, men från egen erfarenhet kan jag säga att dessa kommer vara smått fantastiska för en stor mängd människor innom forskning.

Permalänk
Medlem
Skrivet av jOnÄTÄn:

Vad du överdriver. Det är inte som att du får en hackig upplevelse eller får nöja dig med 50 FPS bara för du har en processor med zen kärnor.

Tror inte han menar så.

Jag tror han menar skillnaden mellan ett billigt grafikkort och ett dyrare grafikkort är större än skillnaden mellan en billig CPU och dyr CPU för konsumenter.

Och han har nog rätt i att så är fallet. Även om man skulle hålla på med videorendering etc. är skillnaden att vänta lite längre ändå mer "behagligt" än att spela med dålig grafik/fps.

Hela resonemanget antar jag handlar om hur "exalterad" man är över flera kärnor.

Visa signatur

System: CPU: AMD Ryzen 9 3900X, MB: Gigabyte X570 Aorus Elite, Minne: Corsair 32GB DDR4 3200MHz, GPU: Asus GeForce RTX 2080 Super ROG Strix Gaming OC

Permalänk
Medlem

Är så gruvligt besviken på hur man inte bara slösar med konsumenters tillit, utan även rena naturresurser och arbetskraft (läs: slaveri) för att framställa chip som känns föråldrade på ett år. Inte för att teknologin rusar framåt, utan för att den syntetiskt hålls tillbaka för att mjölka pengakon till ett sjukt tillstånd.

Visa signatur

I/O-Master 5000 @ 77GHz - 512kb tvärlatensminne - VengeanceXtremeDeathboard Socket-666 - Radeon RV100 DDR

Permalänk
Moderator
Festpilot 2020, Antiallo

Känner att min i5 3570k med ynkliga fyra kärnor och fyra trådar inte hänger... Klarar inte ens MS röj!

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Moderator
Festpilot 2020, Antiallo

*Tog bort ett par §1.6 inlägg.*
/Moderator

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Medlem

med accelerationen av kärnor kanske spelutvecklare i större utsträckning börjar utnyttja fler kärnor?

Visa signatur

Specs: kretskort, koppar, plast, flaskhalsar & spindelnät (yuck!)

Permalänk
Medlem

Skulle sitta fint på jobbet, just nu kör vi modellerna på i7-5820k. Och de kan lätt dra iväg till över 20 timmar om man vill ha riktigt hög upplösning.

Permalänk
Medlem

Haha ska bli intressant o se effektmätning och värmeutveckling för både intels och amds nya cpuer.

Permalänk
Snusfri

Denna bild som jag knåpade ihop tidigare känns än mer relevant.

Visa signatur

WS: i9 13900K - 128GB RAM - 6.5TB SSD - RTX 3090 24GB - LG C2 42" - W11 Pro
LAPTOP 1: Lenovo Gaming 3 - 8GB RAM - 512GB SSD - GTX 1650
LAPTOP 2: Acer Swift 3 - 8GB RAM - 512GB SSD
SERVER: i5 10400F - 64GB RAM - 44TB HDD
NALLE: Pixel 7 Pro

Permalänk
Medlem

Oroväckande i detta core race att dom bara verkar fokusera på mängd kärnor .
Låter ju inte så bra med att bara 2 har minneskontroller & att de andra 2 ska invänta kontakt mellan ram & cpu på 2 av klustrerna. Men är väl för att inte konkurera med EPYC gissar jag. Ska bli intressant & se hur den funkar i tester sen.

Visa signatur

Arne Berg

Permalänk
Medlem
Permalänk
Medlem

Hmm multicore i all ära. Vad jag skulle vilja ha är en CPU med två cores på typ 5-6GHz sen kanske 8-12 till cores som kan vara slöare i t.ex. 3GHz. Till detta behövs ett OS som är bra på att lägga ut jobbet. Enkeltrådade program och trådar där exekveringstiden påverkar prestandan ska köras på de snabba kärnorna. Mycket OS processer och paralella trådar körs på de långsammare.

Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Permalänk
Medlem

@THB:

Permalänk
Inaktiv
Skrivet av Tip Top:

Det här har ju spårat ur helt nu från båda sidor av staketet

vadå spårat ut... tråkigt att dem suttit inne med dem tills nu men kul att det äntligen släpper loss

Permalänk
Medlem
Skrivet av Wiruz:

Jag har 100FPS låst i BF1 och allt på max så vad pratar du om? sen tror jag du är ute och cyklar rätt rejält när du snackar om 10sec haha, Snarare tiotals timmar beroende på vad man sysslar med

Räknar man på fraktaler så är det inga problem att hitta på nåt som en Ryzen 1950X kan få tugga på i några år. (Tänker på tiden före Kalles fraktaler då). Men går att få fram rätt juste saker med bara några dagars beräkningstid.

.

Permalänk
Medlem
Skrivet av anon159643:

Intels 28 core lär spöa skiten ur denna, den här består av 4st kretsar som är ihopsatta.
Fördelen med detta är att det var det enda AMD hade råd med och denna kan bli extremt mycket mer prisvärd och kan bli något vi har råd att köpa.
De som säger att pengar är inget problem, ja köp då ett par Xeon platinum och ingen HEDT. (Xeon platinum kostar runt 100 000kr/st)

Förstår inte varför du citerar mig med denna text? Det är ju inte direkt så att jag påstått något som är värt att diskutera? Såvida du inte anser att AMD inte slår tillbaka? Att dom sen inte kommer göra en knockout på världens största processortillverkare säger ju sig självt kan jag tycka.

Permalänk
Medlem
Skrivet av anon56869:

vadå spårat ut... tråkigt att dem suttit inne med dem tills nu men kul att det äntligen släpper loss

Ja bättre och fixa bättre IPC, Om man får fråga då kör du en 1950x eller en 7980XE då eller, om det bara är kärnor som räknas menar jag

Visa signatur

If it can't run Crisys its a calculater

The New Build The Torrent 2,0

Permalänk
Inaktiv
Skrivet av Tip Top:

Ja bättre och fixa bättre IPC, Om man får fråga då kör du en 1950x eller en 7980XE då eller, om det bara är kärnor som räknas menar jag

va.. nej jag har inte råd med såna just nu sitter med en i7 6800

Men investerar kanske i en 32 kärning när dem kommer, hade varit guld. Men blir kanske en epyc istället.

Permalänk
Datavetare
Skrivet av DevilsDad:

Fast vi snackar ju inte +/-10 sekunder... Under mitt masterarbete körde jag ett par simuleringar som tog en vecka.. Och det var med dubbla 6-kärniga intel cpuer. Jämför vi då intels 4/6-kärniga i7or och TR med 32 kärnor, då snackar vi i runda slängar en månad extra för de 4/6-kärniga...

Du får inse att behoven för olika typer av datorer varierar enormt. En 32-kärning cpu är rena drömmen får någon som sitter och jobbar med lite mer komplexa simuleringar och andra tunga beräkningar. Jag har inte heller superbra koll på alla användingsområden, men från egen erfarenhet kan jag säga att dessa kommer vara smått fantastiska för en stor mängd människor innom forskning.

Nu kan "simulering" betyda rätt mycket, men flaskhalsen för de flesta simuleringar och vetenskapliga beräkningar brukar vara en eller båda av flyttalskapacitet och minnesbandbredd. De flesta vetenskapliga problem kan formuleras m.h.a. av matriser.

Givet ovan, hur är denna 32-kärninga CPU som beskrivs i denna artikel en dröm?

Börjar vi med rå flyttalskapacitet så matchar en 32-kärnors TR @ 3,5 GHz endast en GTX 1050 i 32-bitars flyttal. Finns en anledning varför alla superdatorer byggd de senaste åren har någon form av acceleratorkort i form av GPU, Xeon Phi eller liknade.

32-bitars flyttal duger utmärkt till saker som rendering. Där var tidigare GPGPU ett problem då komplexa scener inte fick plats i VRAM, ett problem som försvunnit med Pascal och Vega då båda dessa kan mappa upp RAM från CPU och använda VRAM som cache.

Men för simuleringar och liknande vill man ofta ha 64-bitars flyttal, då trillar alla konsument GPUer av banan, en 32-kärnors TR @ 3,5 GHz har mer än dubbelt så hög kapacitet jämfört med Titan Xp.

Grejen här är att just vetenskapliga beräkningar är en av de nischer där Intels HEDT-plattform verkligen skiner, räcker faktiskt med en i7-7820X för att matcha teoretisk kapacitet hos en 32-kärnors TR @ 3,5 GHz (kolla in t.ex. SGEMM resultaten i Geekbench 4 eller Matlab-benchmarks där både SGEMM och DGEMM varianter finns, S/DGEMM=Single/Double precision floating General Matrix Multiply).

Epyc har inte haft speciellt mycket framgång som generell server, men finns nischer där man lyckats bra. En sådan är HPC för arbetslaster som skalar väl över kluster (en Epyc paket är ju en form av kluster av fyra 8-kärniga Zen CPUer), där är det en fördel att man har 4x dual-channel RAM då sådana laster inte ser någon fördel med en monolitiskt minnesbuss. Intel får där "bara" sex kanaler mot RAM.

Problemet är att denna TR modell i artikeln inte bara är en Epyc med hälften så mycket minneskanaler, två CPU-kretsar kommer ju bara nå RAM via inter-CPU länkar, något som kommer påverka både RAM och I/O-latens negativt.

Dagens TR har faktiskt högre bandbredd mellan CPU-kretsarna jämfört med Epyc. Detta då varje Zen CPU har tre länkar för att ansluta till andra CPU-kretsar. I Epyc går varje sådan länk till en av de tre andra CPU-kretsarna, i TR används två länkar för att koppla ihop de två CPU-kretsarna så man har ungefär dubbla bandbredden.

I en TR med fyra CPU-kretsar och endast två minneskontroller lär konfigurationen i Epyc vara mindre optimal, gissar att man kommer dra länkar på följande sätt

+-+ +-+ |RAM|###|C|===|C| +-+ +-+ | | | | +-+ +-+ |C|===|C|###|RAM| +-+ +-+

d.v.s. två par av CPU-kretsar har två Inifinity-fabric länkar och detta par är knutna till samma RAM-bank (samma tillhör samma NUMA-zon sett från operativsystemets sida). Problemet är att man tappar den fördel Epyc har då TR "bara" har 2 st dual-channel minneskanaler.

Tror den är den minst dåliga konfigurationen som är möjlig, fråga är bara: förutom att bli en majestätisk Cinebench-dragster, finns det något denna 32-kärniga CPU kommer vara vettig att använda till givet dess konstruktion?

Om målet är att bygga sin egen HPC och givet att förhoppningsvis ingen väljer att köra desktop Windows på mer än åtta kärnor (redan vid sex kärnor ser man att desktop Windows börjar falla efter Linux i t.ex. Geekbench 4 multithread resultat), varför inte köpa en Cavium Thunder X2? $1800 för toppmodellen, en CPU-modell Cray valt som bas till deras Rolls Royce superdator. Där får man en monolitisk 32 kärnor, 128 trådar CPU med 8 minneskanaler.

ThunderX2 är rätt värdelös som desktop-dator p.g.a. relativt låg prestanda per CPU-tråd (dock x86 nivå sett till prestanda per kärna). Fast det gäller ju för alla server CPUer med många kärnor, de är sämre för det vi kör på skrivbordet jämfört med AMD/Intels toppmodeller för konsumentbruk (R7-2700X och i7-8700K).

Vidare blir fördelen med att köra 64-bitars ARM över 64-bitars x86 större ju fler kärnor man stoppar i. Dels drar x86 kärnorna mer ström, men framförallt har 64-bitars ARM en s.k. minneskonsistensmodell som bättre lämpar sig för multitrådade program. x86 har en modell som var vettig när man har några enstaka kärnor, men den blir att mer en kvarnsten ju fler kärnor man stoppar in.

Så för den som anser sig redan idag ha nytta av 32C/128T, varför inte en ARM-server körandes Linux? Finns för leverans under $2000 redan nu!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Klister är billigt 2018 ;=)

Permalänk
Medlem

Där fick vi mao förklaringen till varför Intel haldesperat visade upp en 28-kärnig processor med galen kyllösning. Ja, som de inte berättade något om.

Skickades från m.sweclockers.com

Permalänk
Medlem

Drama på Computex. Ser ut som Intel inte är så glada och att de just gick och hämtade sina 28-kärniga processorer från ASUS och Gigabyte.

https://www.hardocp.com/news/2018/06/06/did_intel_throw_in_28...

Permalänk
Medlem
Skrivet av MrAdde:

På min önskelista står M-ITX för AMD Ryzen Threadripper, det skulle vara sjukt häftigt (och lite dumt) med 16-32 kärnor i ett HTPC-bygge. Se: https://i.redditmedia.com/hWDNsltrNlwrFU_m0TneTKz63aX4Eewu2iOhYiDwsxc.jpg?s=fc74dae59b4bb9213d1af3eb7bdeebec

De skulle kunna köra med so-dimm på baksidan för att få fler minneskanaler. Misstänker att just fyra kanaler och plats för en väldans många gig är en av tjusningarna med denna plattform.

Visa signatur
Permalänk
Medlem
Skrivet av jOnÄTÄn:

Vad du överdriver. Det är inte som att du får en hackig upplevelse eller får nöja dig med 50 FPS bara för du har en processor med zen kärnor.

Hur är det med läsförståelsen? Jag sa att FPS är viktigare än CORES för den stora skalan. FPSen märker man på ett helt annat sätt. Sen om det är Kärnor från Amd eller Nvidia är inte relevant.

Skrivet av Xinpei:

Nu sitter du bara och hittar på. I de flesta scenarion så kommer du inte att märka någon direkt skillnad mellan Ryzen och säg 8700K. Om du nu inte sitter och räknar 1-2 FPS i 1080 och över som "10 sec beräkning" dvs.

Läs ovan. AMD eller Intel har inget med mitt inlägg om FPS vs Kärnor att göra.

Permalänk
Medlem
Skrivet av Wolfkin:

Drama på Computex. Ser ut som Intel inte är så glada och att de just gick och hämtade sina 28-kärniga processorer från ASUS och Gigabyte.

https://www.hardocp.com/news/2018/06/06/did_intel_throw_in_28...

Tycker att Intel agerat underligare och underligare ända sedan AMD släppte Ryzen. Där de tidigare följt en gameplan där de suttit säkert i sitsen och låtit sina CPU:er göra jobbet så har de nu börjat agera mer och mer irrationellt. Det är nästan som de har panik.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Wolfkin:

Drama på Computex. Ser ut som Intel inte är så glada och att de just gick och hämtade sina 28-kärniga processorer från ASUS och Gigabyte.

https://www.hardocp.com/news/2018/06/06/did_intel_throw_in_28...

Jag förstår allvarligt talat inte vad du menar. Intel har allt under kontroll .

Det finns de som menar att Intel inte har något att vara rädd för när det kommer till 2nd Gen2 Threadripper. Och jag kan nog hålla med om det är ytterst få fall där den skulle passa in bra.

Men om Intel inte var rädda så skulle ett vettigt beslut inte vara att kannibalisera sin egen Xenon lineup, tillverka ett nytt moderkort, dra in en 1770W kylare och sedan överklocka den till bristningsgränsen i hopp om att allmänheten ska tro att rosa elefanter kan flyga. (jag har iofs aldrig sett en rosa elefant, men jag tvivlar på att de har de aerodynamiska egenskaperna för att hålla sig luftburna ett bra tag).

Permalänk
Medlem
Skrivet av Yoshman:

Nu kan "simulering" betyda rätt mycket, men flaskhalsen för de flesta simuleringar och vetenskapliga beräkningar brukar vara en eller båda av flyttalskapacitet och minnesbandbredd. De flesta vetenskapliga problem kan formuleras m.h.a. av matriser.

Givet ovan, hur är denna 32-kärninga CPU som beskrivs i denna artikel en dröm?

Börjar vi med rå flyttalskapacitet så matchar en 32-kärnors TR @ 3,5 GHz endast en GTX 1050 i 32-bitars flyttal. Finns en anledning varför alla superdatorer byggd de senaste åren har någon form av acceleratorkort i form av GPU, Xeon Phi eller liknade.

32-bitars flyttal duger utmärkt till saker som rendering. Där var tidigare GPGPU ett problem då komplexa scener inte fick plats i VRAM, ett problem som försvunnit med Pascal och Vega då båda dessa kan mappa upp RAM från CPU och använda VRAM som cache.

Men för simuleringar och liknande vill man ofta ha 64-bitars flyttal, då trillar alla konsument GPUer av banan, en 32-kärnors TR @ 3,5 GHz har mer än dubbelt så hög kapacitet jämfört med Titan Xp.

Grejen här är att just vetenskapliga beräkningar är en av de nischer där Intels HEDT-plattform verkligen skiner, räcker faktiskt med en i7-7820X för att matcha teoretisk kapacitet hos en 32-kärnors TR @ 3,5 GHz (kolla in t.ex. SGEMM resultaten i Geekbench 4 eller Matlab-benchmarks där både SGEMM och DGEMM varianter finns, S/DGEMM=Single/Double precision floating General Matrix Multiply).

Epyc har inte haft speciellt mycket framgång som generell server, men finns nischer där man lyckats bra. En sådan är HPC för arbetslaster som skalar väl över kluster (en Epyc paket är ju en form av kluster av fyra 8-kärniga Zen CPUer), där är det en fördel att man har 4x dual-channel RAM då sådana laster inte ser någon fördel med en monolitiskt minnesbuss. Intel får där "bara" sex kanaler mot RAM.

Problemet är att denna TR modell i artikeln inte bara är en Epyc med hälften så mycket minneskanaler, två CPU-kretsar kommer ju bara nå RAM via inter-CPU länkar, något som kommer påverka både RAM och I/O-latens negativt.

Dagens TR har faktiskt högre bandbredd mellan CPU-kretsarna jämfört med Epyc. Detta då varje Zen CPU har tre länkar för att ansluta till andra CPU-kretsar. I Epyc går varje sådan länk till en av de tre andra CPU-kretsarna, i TR används två länkar för att koppla ihop de två CPU-kretsarna så man har ungefär dubbla bandbredden.

I en TR med fyra CPU-kretsar och endast två minneskontroller lär konfigurationen i Epyc vara mindre optimal, gissar att man kommer dra länkar på följande sätt

+-+ +-+ |RAM|###|C|===|C| +-+ +-+ | | | | +-+ +-+ |C|===|C|###|RAM| +-+ +-+

d.v.s. två par av CPU-kretsar har två Inifinity-fabric länkar och detta par är knutna till samma RAM-bank (samma tillhör samma NUMA-zon sett från operativsystemets sida). Problemet är att man tappar den fördel Epyc har då TR "bara" har 2 st dual-channel minneskanaler.

Tror den är den minst dåliga konfigurationen som är möjlig, fråga är bara: förutom att bli en majestätisk Cinebench-dragster, finns det något denna 32-kärniga CPU kommer vara vettig att använda till givet dess konstruktion?

Om målet är att bygga sin egen HPC och givet att förhoppningsvis ingen väljer att köra desktop Windows på mer än åtta kärnor (redan vid sex kärnor ser man att desktop Windows börjar falla efter Linux i t.ex. Geekbench 4 multithread resultat), varför inte köpa en Cavium Thunder X2? $1800 för toppmodellen, en CPU-modell Cray valt som bas till deras Rolls Royce superdator. Där får man en monolitisk 32 kärnor, 128 trådar CPU med 8 minneskanaler.

ThunderX2 är rätt värdelös som desktop-dator p.g.a. relativt låg prestanda per CPU-tråd (dock x86 nivå sett till prestanda per kärna). Fast det gäller ju för alla server CPUer med många kärnor, de är sämre för det vi kör på skrivbordet jämfört med AMD/Intels toppmodeller för konsumentbruk (R7-2700X och i7-8700K).

Vidare blir fördelen med att köra 64-bitars ARM över 64-bitars x86 större ju fler kärnor man stoppar i. Dels drar x86 kärnorna mer ström, men framförallt har 64-bitars ARM en s.k. minneskonsistensmodell som bättre lämpar sig för multitrådade program. x86 har en modell som var vettig när man har några enstaka kärnor, men den blir att mer en kvarnsten ju fler kärnor man stoppar in.

Så för den som anser sig redan idag ha nytta av 32C/128T, varför inte en ARM-server körandes Linux? Finns för leverans under $2000 redan nu!

Jag får erkänna att de simuleringar jag kört huvudsakligen begränsades av flyttalskapacitet, och jag har inte särskillt bra koll på hur de separata kretsarna i TR kommer påverka prestandan. Mycket intressant information. Min tidigare kommentar får du ställa i relation till kommentaren jag citerade.

De flesta simuleringar utförs trotts allt inte på superdatorer, utan på enskilda forskares persondatorer eller mindre kluster. Där finns även sällan kompetens att köra simulerimgar på GPUer. Denna ARM cpu lät verkligen intressant! Tyvärr är det ofta så att tiden är än mer begränsad än budgeten, och då faller valet på det mest bekanta systemet. Av samma anledning utvecklas tråkigt mycket mjukvara i fortran fortfarande :p.

Skickades från m.sweclockers.com

Permalänk
Datavetare
Skrivet av DevilsDad:

Jag får erkänna att de simuleringar jag kört huvudsakligen begränsades av flyttalskapacitet, och jag har inte särskillt bra koll på hur de separata kretsarna i TR kommer påverka prestandan. Mycket intressant information. Min tidigare kommentar får du ställa i relation till kommentaren jag citerade.

De flesta simuleringar utförs trotts allt inte på superdatorer, utan på enskilda forskares persondatorer eller mindre kluster. Där finns även sällan kompetens att köra simulerimgar på GPUer. Denna ARM cpu lät verkligen intressant! Tyvärr är det ofta så att tiden är än mer begränsad än budgeten, och då faller valet på det mest bekanta systemet. Av samma anledning utvecklas tråkigt mycket mjukvara i fortran fortfarande :p.

Skickades från m.sweclockers.com

M.a.o har inte speciellt mycket ändrats sedan jag gjorde min master (proteinsimuleringar baserade på kvantkemi). Även då fanns parallelldatorcenter på KTH (som innehar superdatorer), hände att vissa av forskarna använde dessa superdatorer men var väldigt sällsynt. Inget jag använde, utan körde det som man till väldigt nära 100 % använda i daglig forskning där: arbetsstationer på institutionen.

Detta var i slutet av 90-talet, så kungen av arbetsstationer hette Alpha 21164. När det kom till flyttal fick Alpha:an min K6-200 att framstå som en miniräknare

Var C++ programmerare redan då och var mäkta förvånad varför forskarna envisades med något så föråldrat (vi pratar alltså för 20 år sedan...) som Fortran. Lärde mig rätt snabbt varför: när man jobbar med saker som som effektivt kan beskrivas som matriser har designen i Fortran en rad fördelar över de flesta programspråk då sättet man kan beskriva matriser är på ett sätt som gör det väldigt mycket enklare för kompilatorn att skapa riktigt effektiv maskinkod.

Även idag vidareutvecklas Fortran just av den anledningen. Och en stor anledning till att Intel trummat på med SSE/AVX och nu AVX-512 är bl.a. att matrisberäkningar passar dessa som hand i handsken! D.v.s. i ditt fall är SKL-X ett självklart val om du vill optimera för matrisberäkningar. Ställer man Zen mot SKL-X så har den senare nästan fyra gånger högre flyttalskapacitet vid matrisberäkningar per kärna och MHz (SKL-X har i teorin dubbelt så hög flyttalskapacitet som desktop-serien, i praktiken får man normalt 70-80 % av det).

Tog faktiskt fram till förra års C++ standard innan man lyckades få in vettigt stöd för att kunna utnyttja SIMD där. Ett mycket mer generellt stöd jämfört med Fortran, men om målet specifikt är just simulering och matrisoperationer lär Fortran fortsätta leva vidare för finns fortfarande fördelar där över andra mer "normala" språk.

Idag finns ju rätt mycket bibliotek (ofta skrivna i just Fortran) som kan enkelt användas från språk som Matlab, Python och R. Även här får man en rejäl boost från saker som AVX och AVX-512. Finns även färdiga CUDA-bibliotek som gör det väldigt enkelt att köra sina Matlab, Python och R beräkningar på GPU, ofta krävs väldigt lite ändringar i själva simuleringen. Om SIMD på CPU eller GPGPU är bästa valet styrs väldigt mycket av vad man gör och därmed vad som är primär flaskhals.

TR;DR ser liksom inte varför någon som jobbar med simuleringar skulle välja ThreadRipper, det är faktiskt en av de områden där plattformen är rätt medioker jämfört med konkurrensen.

Finns absolut områden där Epyc rockar, även inom simulering då det finns fall där bandbredd mot RAM är flaskhals, men det kommer inte vara en stark punkt för kommande 32-kärnors TR då den kommer bli rejält flaskad av RAM (och dagens TR har inte högre bandbredd jämfört med SKL-X). Men när flyttalskapacitet är flaskhals för simulering så är Intels HEDT (eller Skylake SP) och/eller GPUs förstahandsvalet.

Edit: ARM plattformen är i detta kontext en konkurrent till Epyc, båda har högre bandbredd per CPU-socket jämfört med Intel. Dock är Intel (eller GPU/accelerator) förstahandsvalet om flyttalskapacitet är flaskhals.

Är därför nog rätt märkligt att Zen presterar så bra i t.ex. Cinebench, det är begränsat av flyttal! Problemet med Cinebench är att man använder ett omodernt sätt att jobba med flyttal, ett sätt som överhuvudtaget inte kan använda SIMD (och därmed inte heller kan använda GPGPU). Zen är väldigt stark på det "gamla" sättet att använda flyttal, mycket för att Intel helt verkar slutat optimera för det fallet.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd

Lite kängor till Intel.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.