AMD möter upp Intels 28 kärnor med Ryzen Threadripper 2 – 32 kärnor på 250 W

Trädvy Permalänk
Medlem
Registrerad
Aug 2013

...samtidigt gnuggar Microsoft girigt händerna i och med att de gått över till core-licensiering på Windows Server...

*Har en dator. Den är okej, men inte värd att skryta över... ;)

Trädvy Permalänk
Medlem
Registrerad
Apr 2012
Skrivet av XPerion:

The "Battle of Cores" fortsätter....

Vore ju nice om 8 eller 12 blev standard.. 4 har vart standard i 10(?) år.

Trädvy Permalänk
Medlem
Registrerad
Aug 2007
Skrivet av Johan86c:

Ja bättre att spela i 20 fps är att vänta i dagar på att ens beräkning ska bli utförd.
Min 7700K med 64GB ram tar över 14h på sig att ens läsa in en större IFC fil. Under denna tid så är datorn helt låst. Det går alltså inte jobba på dritten, men nu säljs den mest som en spelcpu.

Man kan inte heller köra något större på dem, de kanske duger bra i skolan när man laborerar men sedan går det inte. Det kan jämföras med att spela med 1 fph i spel. (1 frame per hour)

Dessa extrema processorer i High end desktoptopklassen är inte till söndagsseglare utan till för folk som kör lite tyngre laster på sina datorer.

Det jag reagerar på är att folk hela tiden pratar om vanliga personers behov, när de sälja tillhör en nischad grupp med helt annan krav än vanligt folk.
Vanliga användare klarar sig liksom fint med en 5000kr dator och går man upp i en dator för 10 000kr, ja då är det en dator som väldigt få har behov av.

Sedan prat att desktop inte behöver någon datakraft, jag har sett så många här säga det. Men det handlar inte alls om vilken datormodell, utan vilken typ av användare ihop med program.
På samma sätt att en raspberry pi kan fungera perfekt till en server, kanske man behöver ha en 32 core 512GB dator för ens desktop användning.

Håller med dig på varje punkt. Sunt resonemang.
Dock så glömde du dem som köper för att dem kan och inte för att dem behöver
*tittar på mig själv*

Trädvy Permalänk
Medlem
Plats
Karlstad
Registrerad
Nov 2010
Skrivet av Superthug:

Håller med dig på varje punkt. Sunt resonemang.
Dock så glömde du dem som köper för att dem kan och inte för att dem behöver
*tittar på mig själv*

Angående köper för jag kan så är jag precis raka motsatsen och snålar till den förbannelse. Jag har min 7700K och Ryzen 1800X, bortsett från det är det inte många kronor jag har lagt. Mycket har jag fått gratis. Ingen av dessa 2 kommer jag göra någon minimal uppgradering på.

Jag skulle kunna köpa en dator som verkligen imponerar, men sedan bor jag i en liten hyresrätt på 30 kvadrat i en förort. Och det känns vettigare att lägga dessa pengar i handpenning på en lägenhet än en dator. Så ingen kommer se mig bo kvar i min lilla hyres 1:a och skryta på internet om att jag har en 30 core cpu.

Det tragiska är dock att man hela tiden tvingas att köpa mer utrustning för jobb, likaså programvaror.

Jag skulle tro det är många här som är i min sits, de kan köpa en dator som verkligen imponerar över hela internet eller man kan fixa ordning på ens liv. hehe

Gått över till enbart Google Chromebook på klientsidan.

Trädvy Permalänk
Medlem
Plats
Linköping
Registrerad
Okt 2009
Skrivet av Yoshman:

M.a.o har inte speciellt mycket ändrats sedan jag gjorde min master (proteinsimuleringar baserade på kvantkemi). Även då fanns parallelldatorcenter på KTH (som innehar superdatorer), hände att vissa av forskarna använde dessa superdatorer men var väldigt sällsynt. Inget jag använde, utan körde det som man till väldigt nära 100 % använda i daglig forskning där: arbetsstationer på institutionen.

Detta var i slutet av 90-talet, så kungen av arbetsstationer hette Alpha 21164. När det kom till flyttal fick Alpha:an min K6-200 att framstå som en miniräknare

Var C++ programmerare redan då och var mäkta förvånad varför forskarna envisades med något så föråldrat (vi pratar alltså för 20 år sedan...) som Fortran. Lärde mig rätt snabbt varför: när man jobbar med saker som som effektivt kan beskrivas som matriser har designen i Fortran en rad fördelar över de flesta programspråk då sättet man kan beskriva matriser är på ett sätt som gör det väldigt mycket enklare för kompilatorn att skapa riktigt effektiv maskinkod.

Även idag vidareutvecklas Fortran just av den anledningen. Och en stor anledning till att Intel trummat på med SSE/AVX och nu AVX-512 är bl.a. att matrisberäkningar passar dessa som hand i handsken! D.v.s. i ditt fall är SKL-X ett självklart val om du vill optimera för matrisberäkningar. Ställer man Zen mot SKL-X så har den senare nästan fyra gånger högre flyttalskapacitet vid matrisberäkningar per kärna och MHz (SKL-X har i teorin dubbelt så hög flyttalskapacitet som desktop-serien, i praktiken får man normalt 70-80 % av det).

Tog faktiskt fram till förra års C++ standard innan man lyckades få in vettigt stöd för att kunna utnyttja SIMD där. Ett mycket mer generellt stöd jämfört med Fortran, men om målet specifikt är just simulering och matrisoperationer lär Fortran fortsätta leva vidare för finns fortfarande fördelar där över andra mer "normala" språk.

Idag finns ju rätt mycket bibliotek (ofta skrivna i just Fortran) som kan enkelt användas från språk som Matlab, Python och R. Även här får man en rejäl boost från saker som AVX och AVX-512. Finns även färdiga CUDA-bibliotek som gör det väldigt enkelt att köra sina Matlab, Python och R beräkningar på GPU, ofta krävs väldigt lite ändringar i själva simuleringen. Om SIMD på CPU eller GPGPU är bästa valet styrs väldigt mycket av vad man gör och därmed vad som är primär flaskhals.

TR;DR ser liksom inte varför någon som jobbar med simuleringar skulle välja ThreadRipper, det är faktiskt en av de områden där plattformen är rätt medioker jämfört med konkurrensen.

Finns absolut områden där Epyc rockar, även inom simulering då det finns fall där bandbredd mot RAM är flaskhals, men det kommer inte vara en stark punkt för kommande 32-kärnors TR då den kommer bli rejält flaskad av RAM (och dagens TR har inte högre bandbredd jämfört med SKL-X). Men när flyttalskapacitet är flaskhals för simulering så är Intels HEDT (eller Skylake SP) och/eller GPUs förstahandsvalet.

Edit: ARM plattformen är i detta kontext en konkurrent till Epyc, båda har högre bandbredd per CPU-socket jämfört med Intel. Dock är Intel (eller GPU/accelerator) förstahandsvalet om flyttalskapacitet är flaskhals.

Är därför nog rätt märkligt att Zen presterar så bra i t.ex. Cinebench, det är begränsat av flyttal! Problemet med Cinebench är att man använder ett omodernt sätt att jobba med flyttal, ett sätt som överhuvudtaget inte kan använda SIMD (och därmed inte heller kan använda GPGPU). Zen är väldigt stark på det "gamla" sättet att använda flyttal, mycket för att Intel helt verkar slutat optimera för det fallet.

Som anekdot då du ändå tog upp fortran så gjorde vi en labb inom tillämpad mekanik under den senaste terminen där vi fick skriva subrutiner i just fortran, så det används fortfarande i allra högsta grad iallafall inom det akademiska.
Men som du även säger så börjar det gå över mer till Matlab, python och liknande just för att relativt snabbt kunna ta fram prototyp där de inbyggda funktionerna för bl.a. matrisoperationer (ofta) är skriva i fortran.

MAIN:   | 4770k | r9 290 tri-x OC | 16GB | Be Quiet Shadow Rock 2 | Corsair 350D | EVGA Supernova G2 850w |
HTPC:   | 4360 | 8GB | Scythe Shuriken Rev. B | Cooler Master Elite 120 |
Laptop: HP spectre x360

Trädvy Permalänk
Medlem
Registrerad
Okt 2003
Skrivet av Yoshman:

Nu kan "simulering" betyda rätt mycket, men flaskhalsen för de flesta simuleringar och vetenskapliga beräkningar brukar vara en eller båda av flyttalskapacitet och minnesbandbredd. De flesta vetenskapliga problem kan formuleras m.h.a. av matriser.

Givet ovan, hur är denna 32-kärninga CPU som beskrivs i denna artikel en dröm?

Börjar vi med rå flyttalskapacitet så matchar en 32-kärnors TR @ 3,5 GHz endast en GTX 1050 i 32-bitars flyttal. Finns en anledning varför alla superdatorer byggd de senaste åren har någon form av acceleratorkort i form av GPU, Xeon Phi eller liknade.

32-bitars flyttal duger utmärkt till saker som rendering. Där var tidigare GPGPU ett problem då komplexa scener inte fick plats i VRAM, ett problem som försvunnit med Pascal och Vega då båda dessa kan mappa upp RAM från CPU och använda VRAM som cache.

Men för simuleringar och liknande vill man ofta ha 64-bitars flyttal, då trillar alla konsument GPUer av banan, en 32-kärnors TR @ 3,5 GHz har mer än dubbelt så hög kapacitet jämfört med Titan Xp.

Grejen här är att just vetenskapliga beräkningar är en av de nischer där Intels HEDT-plattform verkligen skiner, räcker faktiskt med en i7-7820X för att matcha teoretisk kapacitet hos en 32-kärnors TR @ 3,5 GHz (kolla in t.ex. SGEMM resultaten i Geekbench 4 eller Matlab-benchmarks där både SGEMM och DGEMM varianter finns, S/DGEMM=Single/Double precision floating General Matrix Multiply).

Epyc har inte haft speciellt mycket framgång som generell server, men finns nischer där man lyckats bra. En sådan är HPC för arbetslaster som skalar väl över kluster (en Epyc paket är ju en form av kluster av fyra 8-kärniga Zen CPUer), där är det en fördel att man har 4x dual-channel RAM då sådana laster inte ser någon fördel med en monolitiskt minnesbuss. Intel får där "bara" sex kanaler mot RAM.

Problemet är att denna TR modell i artikeln inte bara är en Epyc med hälften så mycket minneskanaler, två CPU-kretsar kommer ju bara nå RAM via inter-CPU länkar, något som kommer påverka både RAM och I/O-latens negativt.

Dagens TR har faktiskt högre bandbredd mellan CPU-kretsarna jämfört med Epyc. Detta då varje Zen CPU har tre länkar för att ansluta till andra CPU-kretsar. I Epyc går varje sådan länk till en av de tre andra CPU-kretsarna, i TR används två länkar för att koppla ihop de två CPU-kretsarna så man har ungefär dubbla bandbredden.

I en TR med fyra CPU-kretsar och endast två minneskontroller lär konfigurationen i Epyc vara mindre optimal, gissar att man kommer dra länkar på följande sätt

+-+ +-+ |RAM|###|C|===|C| +-+ +-+ | | | | +-+ +-+ |C|===|C|###|RAM| +-+ +-+

d.v.s. två par av CPU-kretsar har två Inifinity-fabric länkar och detta par är knutna till samma RAM-bank (samma tillhör samma NUMA-zon sett från operativsystemets sida). Problemet är att man tappar den fördel Epyc har då TR "bara" har 2 st dual-channel minneskanaler.

Tror den är den minst dåliga konfigurationen som är möjlig, fråga är bara: förutom att bli en majestätisk Cinebench-dragster, finns det något denna 32-kärniga CPU kommer vara vettig att använda till givet dess konstruktion?

Om målet är att bygga sin egen HPC och givet att förhoppningsvis ingen väljer att köra desktop Windows på mer än åtta kärnor (redan vid sex kärnor ser man att desktop Windows börjar falla efter Linux i t.ex. Geekbench 4 multithread resultat), varför inte köpa en Cavium Thunder X2? $1800 för toppmodellen, en CPU-modell Cray valt som bas till deras Rolls Royce superdator. Där får man en monolitisk 32 kärnor, 128 trådar CPU med 8 minneskanaler.

ThunderX2 är rätt värdelös som desktop-dator p.g.a. relativt låg prestanda per CPU-tråd (dock x86 nivå sett till prestanda per kärna). Fast det gäller ju för alla server CPUer med många kärnor, de är sämre för det vi kör på skrivbordet jämfört med AMD/Intels toppmodeller för konsumentbruk (R7-2700X och i7-8700K).

Vidare blir fördelen med att köra 64-bitars ARM över 64-bitars x86 större ju fler kärnor man stoppar i. Dels drar x86 kärnorna mer ström, men framförallt har 64-bitars ARM en s.k. minneskonsistensmodell som bättre lämpar sig för multitrådade program. x86 har en modell som var vettig när man har några enstaka kärnor, men den blir att mer en kvarnsten ju fler kärnor man stoppar in.

Så för den som anser sig redan idag ha nytta av 32C/128T, varför inte en ARM-server körandes Linux? Finns för leverans under $2000 redan nu!

ThunderX2 ser ju helt magisk ut för OpenFOAM, tack för informationen! Nu gäller det att få tag på en leverantör bara

"Trying is the first step to failure." - Homer Simpson

Trädvy Permalänk
Medlem
Plats
Strängnäs
Registrerad
Aug 2005
Skrivet av FYNXER:

----------------
Notis till alla backstugusittare ute i landet! NEJ, det räcker inte med 4, 8 eller 16 kärnor. Framsteg måste ske för att skapa innovation och nya sätt att använda våra datorer. Om 10 år kommer PC världen se avsevärt annorlunda ut just pga av alla dessa kärnor, då kommer fyra kärnor endast duga till att ha i IOT som brödrosten, kaffebryggaren eller kylskåpet medans du kommer att ha upp till 128 kärnor eller mer i din hem PC för att klara av att skapa fantastiska världar i t ex VR och AR m.m.

Kanske om Intel/Amd gör en arkitektur som har 128c men presenterar sig som 1 med en ooooootroligt hög IPC då jag hört alltför många programmerare som tycker att multitråda sina program är svårare än att lära sig tala rövarspråket på japanska.

Skrivet av Laxen123:

med accelerationen av kärnor kanske spelutvecklare i större utsträckning börjar utnyttja fler kärnor?

Har överlag vart jäkligt kasst med flertrådning i spel...

Har till och med stått på en del skräckhistorier om spel där HT ställer till trassel och folk på en del forum förespråkar att inaktivera HT, vilket leder till att jag får höra "min son säger att hans spel går bättre utan HT och 2 kärnor avstängda i bios" från kunder som har glömt att lära ungarna att allt man läser på internet inte är sant...

Trädvy Permalänk
Medlem
Registrerad
Maj 2002

Tycker det är utomordentligt roligt att se denna konkurrensen. Och baske mig om inte AMD ser ut att vara mer på hugget än Intel det senaste. Fina grejor!

[Tycker jag.] 4790k@4.5 \\ GTX 1080 Strix@2139/10332 \\ ÄGskärm SA950 \\ Novatouch TKL \\ 2xSSD \\ 16GB \\ Tesla 600W i NZXT. Win7.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Jan 2007
Skrivet av Johan86c:

Ja bättre att spela i 20 fps är att vänta i dagar på att ens beräkning ska bli utförd.
Min 7700K med 64GB ram tar över 14h på sig att ens läsa in en större IFC fil. Under denna tid så är datorn helt låst. Det går alltså inte jobba på dritten, men nu säljs den mest som en spelcpu.

Vad är en IFC-fil?

| Fractal Design Define R5 | Asrock X399 Fatal1ty | AMD Ryzen Threadripper 1950X | Enermax Liqtech 360 | Corsair Vengeance LPX 4x8GB 3200 C16 | OCZ ZX 1000W | ASUS GTX 1070 Ti Strix | Samsung TA24-550 | Debian Sid | LXQt |

Trädvy Permalänk
Medlem
Plats
Uppsala
Registrerad
Maj 2017
Trädvy Permalänk
Medlem
Plats
Karlskrona
Registrerad
Aug 2009

"Möter upp"? Hur kan man möta upp en produkt som inte finns?

Asus Zenith Extreme | 32gb DDR4 3200MHZ CL14 | Threadripper 1950X | 1080Ti
Asus Z97 Pro Gamer | 32gb ram DDR3 2400MHz | i7 4790k | 2 x R9 390 - Barnen fått ta över
Asrock P67 Extreme4 rev3 | 16gb DDR3 2400MHz | i7 2600K | R9 290 - Barnen fått ta över
En massa bärbara, servrar, RPi's och andra boxar

Trädvy Permalänk
Medlem
Registrerad
Jul 2017
Skrivet av inquam:

"Möter upp"? Hur kan man möta upp en produkt som inte finns?

Så du menar att Xeon 8180 inte existerar?

NZXT H440 | Intel i7 7700K @ 5 GHz | Asus strix Z270H Gaming | 16GB Corsair DDR4 3200 mhz | Asus strix GTX 980 | 512 GB Samsung Pro 850 SSD | Corsair HX750 |

Trädvy Permalänk
Medlem
Plats
Kina
Registrerad
Jun 2017
Skrivet av Tip Top:

Det här har ju spårat ur helt nu från båda sidor av staketet

Kul tycker jag som utvecklare

Jag försöker skriva alla mina program så de utnyttjar hårdvaran så bra som möjligt.

Allt från bildkonverteringar till MP3 konverteringar till Machine Learning till att rippa 4K filmer

Blir en ganska så stor skillnad att konvertera en 4K film med 32 trådar i jämförelse med 1st tråd.

Trädvy Permalänk
Medlem
Plats
Karlskrona
Registrerad
Aug 2009
Skrivet av Xinpei:

Så du menar att Xeon 8180 inte existerar?

Nej, jag menar att det de försökte få det att framstå som att de demade på scen, en 5GHz 28-core konsumentinriktad HEDT CPU, inte existerar.

Asus Zenith Extreme | 32gb DDR4 3200MHZ CL14 | Threadripper 1950X | 1080Ti
Asus Z97 Pro Gamer | 32gb ram DDR3 2400MHz | i7 4790k | 2 x R9 390 - Barnen fått ta över
Asrock P67 Extreme4 rev3 | 16gb DDR3 2400MHz | i7 2600K | R9 290 - Barnen fått ta över
En massa bärbara, servrar, RPi's och andra boxar

Trädvy Permalänk
Medlem
Registrerad
Apr 2012
Skrivet av inquam:

Nej, jag menar att det de försökte få det att framstå som att de demade på scen, en 5GHz 28-core konsumentinriktad HEDT CPU, inte existerar.

Vaddå 2.7GHz är väl samma sak *host* bra jobbat där Intel.

Trädvy Permalänk
Medlem
Plats
Karlstad
Registrerad
Nov 2010
Skrivet av sAAb:

Vad är en IFC-fil?

En standardiserad exportfil inom BIM (cad) som gör att man kan dela information mellan olika program. Vissa påstår att detta ska vara orginalet men det är för tungdrivet.

Nå det är :inga som helst konstigheter med att vänta timmar på att filer ska öppnas, majoriten gör dock väldigt små saker inom allt. Ta excel så har jag lösningar som det tar över ett dygn att köra, medans andra inte förstår detta. Men det är som matematik där elever i grundskolan inte ser hur en matematisk uträkning på en dator kan ta en längre stund, då alla operationer som de i datorns miniräknare utför av typ 5+2 går snabbare än ett ögonblick.

Gått över till enbart Google Chromebook på klientsidan.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Jan 2007
Skrivet av Johan86c:

En standardiserad exportfil inom BIM (cad) som gör att man kan dela information mellan olika program. Vissa påstår att detta ska vara orginalet men det är för tungdrivet.

Nå det är :inga som helst konstigheter med att vänta timmar på att filer ska öppnas, majoriten gör dock väldigt små saker inom allt. Ta excel så har jag lösningar som det tar över ett dygn att köra, medans andra inte förstår detta. Men det är som matematik där elever i grundskolan inte ser hur en matematisk uträkning på en dator kan ta en längre stund, då alla operationer som de i datorns miniräknare utför av typ 5+2 går snabbare än ett ögonblick.

Det låter ju som att I/O är helt/ganska/något/lite irrelevant här. Alla beroenden måste byggas upp" på nytt. Hur många objekt eller delar snackar vi om när man har fjorton timmar för att återskapa alla objekt?!

Skickades från m.sweclockers.com

| Fractal Design Define R5 | Asrock X399 Fatal1ty | AMD Ryzen Threadripper 1950X | Enermax Liqtech 360 | Corsair Vengeance LPX 4x8GB 3200 C16 | OCZ ZX 1000W | ASUS GTX 1070 Ti Strix | Samsung TA24-550 | Debian Sid | LXQt |