AMD möter upp Intels 28 kärnor med Ryzen Threadripper 2 – 32 kärnor på 250 W

Permalänk
Medlem

...samtidigt gnuggar Microsoft girigt händerna i och med att de gått över till core-licensiering på Windows Server...

Visa signatur

*Har en dator. Den är okej, men inte värd att skryta över... ;)

Permalänk
Medlem
Skrivet av XPerion:

The "Battle of Cores" fortsätter....

Vore ju nice om 8 eller 12 blev standard.. 4 har vart standard i 10(?) år.

Permalänk
Medlem
Skrivet av anon159643:

Ja bättre att spela i 20 fps är att vänta i dagar på att ens beräkning ska bli utförd.
Min 7700K med 64GB ram tar över 14h på sig att ens läsa in en större IFC fil. Under denna tid så är datorn helt låst. Det går alltså inte jobba på dritten, men nu säljs den mest som en spelcpu.

Man kan inte heller köra något större på dem, de kanske duger bra i skolan när man laborerar men sedan går det inte. Det kan jämföras med att spela med 1 fph i spel. (1 frame per hour)

Dessa extrema processorer i High end desktoptopklassen är inte till söndagsseglare utan till för folk som kör lite tyngre laster på sina datorer.

Det jag reagerar på är att folk hela tiden pratar om vanliga personers behov, när de sälja tillhör en nischad grupp med helt annan krav än vanligt folk.
Vanliga användare klarar sig liksom fint med en 5000kr dator och går man upp i en dator för 10 000kr, ja då är det en dator som väldigt få har behov av.

Sedan prat att desktop inte behöver någon datakraft, jag har sett så många här säga det. Men det handlar inte alls om vilken datormodell, utan vilken typ av användare ihop med program.
På samma sätt att en raspberry pi kan fungera perfekt till en server, kanske man behöver ha en 32 core 512GB dator för ens desktop användning.

Håller med dig på varje punkt. Sunt resonemang.
Dock så glömde du dem som köper för att dem kan och inte för att dem behöver
*tittar på mig själv*

Permalänk
Inaktiv
Skrivet av Superthug:

Håller med dig på varje punkt. Sunt resonemang.
Dock så glömde du dem som köper för att dem kan och inte för att dem behöver
*tittar på mig själv*

Angående köper för jag kan så är jag precis raka motsatsen och snålar till den förbannelse. Jag har min 7700K och Ryzen 1800X, bortsett från det är det inte många kronor jag har lagt. Mycket har jag fått gratis. Ingen av dessa 2 kommer jag göra någon minimal uppgradering på.

Jag skulle kunna köpa en dator som verkligen imponerar, men sedan bor jag i en liten hyresrätt på 30 kvadrat i en förort. Och det känns vettigare att lägga dessa pengar i handpenning på en lägenhet än en dator. Så ingen kommer se mig bo kvar i min lilla hyres 1:a och skryta på internet om att jag har en 30 core cpu.

Det tragiska är dock att man hela tiden tvingas att köpa mer utrustning för jobb, likaså programvaror.

Jag skulle tro det är många här som är i min sits, de kan köpa en dator som verkligen imponerar över hela internet eller man kan fixa ordning på ens liv. hehe

Permalänk
Medlem
Skrivet av Yoshman:

M.a.o har inte speciellt mycket ändrats sedan jag gjorde min master (proteinsimuleringar baserade på kvantkemi). Även då fanns parallelldatorcenter på KTH (som innehar superdatorer), hände att vissa av forskarna använde dessa superdatorer men var väldigt sällsynt. Inget jag använde, utan körde det som man till väldigt nära 100 % använda i daglig forskning där: arbetsstationer på institutionen.

Detta var i slutet av 90-talet, så kungen av arbetsstationer hette Alpha 21164. När det kom till flyttal fick Alpha:an min K6-200 att framstå som en miniräknare

Var C++ programmerare redan då och var mäkta förvånad varför forskarna envisades med något så föråldrat (vi pratar alltså för 20 år sedan...) som Fortran. Lärde mig rätt snabbt varför: när man jobbar med saker som som effektivt kan beskrivas som matriser har designen i Fortran en rad fördelar över de flesta programspråk då sättet man kan beskriva matriser är på ett sätt som gör det väldigt mycket enklare för kompilatorn att skapa riktigt effektiv maskinkod.

Även idag vidareutvecklas Fortran just av den anledningen. Och en stor anledning till att Intel trummat på med SSE/AVX och nu AVX-512 är bl.a. att matrisberäkningar passar dessa som hand i handsken! D.v.s. i ditt fall är SKL-X ett självklart val om du vill optimera för matrisberäkningar. Ställer man Zen mot SKL-X så har den senare nästan fyra gånger högre flyttalskapacitet vid matrisberäkningar per kärna och MHz (SKL-X har i teorin dubbelt så hög flyttalskapacitet som desktop-serien, i praktiken får man normalt 70-80 % av det).

Tog faktiskt fram till förra års C++ standard innan man lyckades få in vettigt stöd för att kunna utnyttja SIMD där. Ett mycket mer generellt stöd jämfört med Fortran, men om målet specifikt är just simulering och matrisoperationer lär Fortran fortsätta leva vidare för finns fortfarande fördelar där över andra mer "normala" språk.

Idag finns ju rätt mycket bibliotek (ofta skrivna i just Fortran) som kan enkelt användas från språk som Matlab, Python och R. Även här får man en rejäl boost från saker som AVX och AVX-512. Finns även färdiga CUDA-bibliotek som gör det väldigt enkelt att köra sina Matlab, Python och R beräkningar på GPU, ofta krävs väldigt lite ändringar i själva simuleringen. Om SIMD på CPU eller GPGPU är bästa valet styrs väldigt mycket av vad man gör och därmed vad som är primär flaskhals.

TR;DR ser liksom inte varför någon som jobbar med simuleringar skulle välja ThreadRipper, det är faktiskt en av de områden där plattformen är rätt medioker jämfört med konkurrensen.

Finns absolut områden där Epyc rockar, även inom simulering då det finns fall där bandbredd mot RAM är flaskhals, men det kommer inte vara en stark punkt för kommande 32-kärnors TR då den kommer bli rejält flaskad av RAM (och dagens TR har inte högre bandbredd jämfört med SKL-X). Men när flyttalskapacitet är flaskhals för simulering så är Intels HEDT (eller Skylake SP) och/eller GPUs förstahandsvalet.

Edit: ARM plattformen är i detta kontext en konkurrent till Epyc, båda har högre bandbredd per CPU-socket jämfört med Intel. Dock är Intel (eller GPU/accelerator) förstahandsvalet om flyttalskapacitet är flaskhals.

Är därför nog rätt märkligt att Zen presterar så bra i t.ex. Cinebench, det är begränsat av flyttal! Problemet med Cinebench är att man använder ett omodernt sätt att jobba med flyttal, ett sätt som överhuvudtaget inte kan använda SIMD (och därmed inte heller kan använda GPGPU). Zen är väldigt stark på det "gamla" sättet att använda flyttal, mycket för att Intel helt verkar slutat optimera för det fallet.

Som anekdot då du ändå tog upp fortran så gjorde vi en labb inom tillämpad mekanik under den senaste terminen där vi fick skriva subrutiner i just fortran, så det används fortfarande i allra högsta grad iallafall inom det akademiska.
Men som du även säger så börjar det gå över mer till Matlab, python och liknande just för att relativt snabbt kunna ta fram prototyp där de inbyggda funktionerna för bl.a. matrisoperationer (ofta) är skriva i fortran.

Visa signatur

MAIN:   | 4770k | r9 290 tri-x OC | 16GB | Be Quiet Shadow Rock 2 | Corsair 350D | EVGA Supernova G2 850w |
HTPC:   | 4360 | 8GB | Scythe Shuriken Rev. B | Cooler Master Elite 120 |
Laptop: HP spectre x360

Permalänk
Medlem
Skrivet av Yoshman:

Nu kan "simulering" betyda rätt mycket, men flaskhalsen för de flesta simuleringar och vetenskapliga beräkningar brukar vara en eller båda av flyttalskapacitet och minnesbandbredd. De flesta vetenskapliga problem kan formuleras m.h.a. av matriser.

Givet ovan, hur är denna 32-kärninga CPU som beskrivs i denna artikel en dröm?

Börjar vi med rå flyttalskapacitet så matchar en 32-kärnors TR @ 3,5 GHz endast en GTX 1050 i 32-bitars flyttal. Finns en anledning varför alla superdatorer byggd de senaste åren har någon form av acceleratorkort i form av GPU, Xeon Phi eller liknade.

32-bitars flyttal duger utmärkt till saker som rendering. Där var tidigare GPGPU ett problem då komplexa scener inte fick plats i VRAM, ett problem som försvunnit med Pascal och Vega då båda dessa kan mappa upp RAM från CPU och använda VRAM som cache.

Men för simuleringar och liknande vill man ofta ha 64-bitars flyttal, då trillar alla konsument GPUer av banan, en 32-kärnors TR @ 3,5 GHz har mer än dubbelt så hög kapacitet jämfört med Titan Xp.

Grejen här är att just vetenskapliga beräkningar är en av de nischer där Intels HEDT-plattform verkligen skiner, räcker faktiskt med en i7-7820X för att matcha teoretisk kapacitet hos en 32-kärnors TR @ 3,5 GHz (kolla in t.ex. SGEMM resultaten i Geekbench 4 eller Matlab-benchmarks där både SGEMM och DGEMM varianter finns, S/DGEMM=Single/Double precision floating General Matrix Multiply).

Epyc har inte haft speciellt mycket framgång som generell server, men finns nischer där man lyckats bra. En sådan är HPC för arbetslaster som skalar väl över kluster (en Epyc paket är ju en form av kluster av fyra 8-kärniga Zen CPUer), där är det en fördel att man har 4x dual-channel RAM då sådana laster inte ser någon fördel med en monolitiskt minnesbuss. Intel får där "bara" sex kanaler mot RAM.

Problemet är att denna TR modell i artikeln inte bara är en Epyc med hälften så mycket minneskanaler, två CPU-kretsar kommer ju bara nå RAM via inter-CPU länkar, något som kommer påverka både RAM och I/O-latens negativt.

Dagens TR har faktiskt högre bandbredd mellan CPU-kretsarna jämfört med Epyc. Detta då varje Zen CPU har tre länkar för att ansluta till andra CPU-kretsar. I Epyc går varje sådan länk till en av de tre andra CPU-kretsarna, i TR används två länkar för att koppla ihop de två CPU-kretsarna så man har ungefär dubbla bandbredden.

I en TR med fyra CPU-kretsar och endast två minneskontroller lär konfigurationen i Epyc vara mindre optimal, gissar att man kommer dra länkar på följande sätt

+-+ +-+ |RAM|###|C|===|C| +-+ +-+ | | | | +-+ +-+ |C|===|C|###|RAM| +-+ +-+

d.v.s. två par av CPU-kretsar har två Inifinity-fabric länkar och detta par är knutna till samma RAM-bank (samma tillhör samma NUMA-zon sett från operativsystemets sida). Problemet är att man tappar den fördel Epyc har då TR "bara" har 2 st dual-channel minneskanaler.

Tror den är den minst dåliga konfigurationen som är möjlig, fråga är bara: förutom att bli en majestätisk Cinebench-dragster, finns det något denna 32-kärniga CPU kommer vara vettig att använda till givet dess konstruktion?

Om målet är att bygga sin egen HPC och givet att förhoppningsvis ingen väljer att köra desktop Windows på mer än åtta kärnor (redan vid sex kärnor ser man att desktop Windows börjar falla efter Linux i t.ex. Geekbench 4 multithread resultat), varför inte köpa en Cavium Thunder X2? $1800 för toppmodellen, en CPU-modell Cray valt som bas till deras Rolls Royce superdator. Där får man en monolitisk 32 kärnor, 128 trådar CPU med 8 minneskanaler.

ThunderX2 är rätt värdelös som desktop-dator p.g.a. relativt låg prestanda per CPU-tråd (dock x86 nivå sett till prestanda per kärna). Fast det gäller ju för alla server CPUer med många kärnor, de är sämre för det vi kör på skrivbordet jämfört med AMD/Intels toppmodeller för konsumentbruk (R7-2700X och i7-8700K).

Vidare blir fördelen med att köra 64-bitars ARM över 64-bitars x86 större ju fler kärnor man stoppar i. Dels drar x86 kärnorna mer ström, men framförallt har 64-bitars ARM en s.k. minneskonsistensmodell som bättre lämpar sig för multitrådade program. x86 har en modell som var vettig när man har några enstaka kärnor, men den blir att mer en kvarnsten ju fler kärnor man stoppar in.

Så för den som anser sig redan idag ha nytta av 32C/128T, varför inte en ARM-server körandes Linux? Finns för leverans under $2000 redan nu!

ThunderX2 ser ju helt magisk ut för OpenFOAM, tack för informationen! Nu gäller det att få tag på en leverantör bara

Visa signatur

"Trying is the first step to failure." - Homer Simpson

Permalänk
Medlem
Skrivet av anon162230:

----------------
Notis till alla backstugusittare ute i landet! NEJ, det räcker inte med 4, 8 eller 16 kärnor. Framsteg måste ske för att skapa innovation och nya sätt att använda våra datorer. Om 10 år kommer PC världen se avsevärt annorlunda ut just pga av alla dessa kärnor, då kommer fyra kärnor endast duga till att ha i IOT som brödrosten, kaffebryggaren eller kylskåpet medans du kommer att ha upp till 128 kärnor eller mer i din hem PC för att klara av att skapa fantastiska världar i t ex VR och AR m.m.

Kanske om Intel/Amd gör en arkitektur som har 128c men presenterar sig som 1 med en ooooootroligt hög IPC då jag hört alltför många programmerare som tycker att multitråda sina program är svårare än att lära sig tala rövarspråket på japanska.

Skrivet av Laxen123:

med accelerationen av kärnor kanske spelutvecklare i större utsträckning börjar utnyttja fler kärnor?

Har överlag vart jäkligt kasst med flertrådning i spel...

Har till och med stått på en del skräckhistorier om spel där HT ställer till trassel och folk på en del forum förespråkar att inaktivera HT, vilket leder till att jag får höra "min son säger att hans spel går bättre utan HT och 2 kärnor avstängda i bios" från kunder som har glömt att lära ungarna att allt man läser på internet inte är sant...

Permalänk

Tycker det är utomordentligt roligt att se denna konkurrensen. Och baske mig om inte AMD ser ut att vara mer på hugget än Intel det senaste. Fina grejor!

Visa signatur

[4790k@4.6]+[RTX 3070 OC]+[16GB]+[4x SSD]+[NZXT+700W Gold]+[Win7]+[2x Samsung SA27950D <3]+[Topre TKL]+[G403 Hero wired]+[HyperX Cloud Alpha S]+[KingKong 2 Pro]. ZBook 17 G5, Quadro P3200, Win11.

Permalänk
Medlem
Skrivet av anon159643:

Ja bättre att spela i 20 fps är att vänta i dagar på att ens beräkning ska bli utförd.
Min 7700K med 64GB ram tar över 14h på sig att ens läsa in en större IFC fil. Under denna tid så är datorn helt låst. Det går alltså inte jobba på dritten, men nu säljs den mest som en spelcpu.

Vad är en IFC-fil?

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Permalänk
Medlem

"Möter upp"? Hur kan man möta upp en produkt som inte finns?

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Permalänk
Medlem
Skrivet av inquam:

"Möter upp"? Hur kan man möta upp en produkt som inte finns?

Så du menar att Xeon 8180 inte existerar?

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Tip Top:

Det här har ju spårat ur helt nu från båda sidor av staketet

Kul tycker jag som utvecklare

Jag försöker skriva alla mina program så de utnyttjar hårdvaran så bra som möjligt.

Allt från bildkonverteringar till MP3 konverteringar till Machine Learning till att rippa 4K filmer

Blir en ganska så stor skillnad att konvertera en 4K film med 32 trådar i jämförelse med 1st tråd.

Permalänk
Medlem
Skrivet av Xinpei:

Så du menar att Xeon 8180 inte existerar?

Nej, jag menar att det de försökte få det att framstå som att de demade på scen, en 5GHz 28-core konsumentinriktad HEDT CPU, inte existerar.

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Permalänk
Medlem
Skrivet av inquam:

Nej, jag menar att det de försökte få det att framstå som att de demade på scen, en 5GHz 28-core konsumentinriktad HEDT CPU, inte existerar.

Vaddå 2.7GHz är väl samma sak *host* bra jobbat där Intel.

Permalänk
Inaktiv
Skrivet av sAAb:

Vad är en IFC-fil?

En standardiserad exportfil inom BIM (cad) som gör att man kan dela information mellan olika program. Vissa påstår att detta ska vara orginalet men det är för tungdrivet.

Nå det är :inga som helst konstigheter med att vänta timmar på att filer ska öppnas, majoriten gör dock väldigt små saker inom allt. Ta excel så har jag lösningar som det tar över ett dygn att köra, medans andra inte förstår detta. Men det är som matematik där elever i grundskolan inte ser hur en matematisk uträkning på en dator kan ta en längre stund, då alla operationer som de i datorns miniräknare utför av typ 5+2 går snabbare än ett ögonblick.

Permalänk
Medlem
Skrivet av anon159643:

En standardiserad exportfil inom BIM (cad) som gör att man kan dela information mellan olika program. Vissa påstår att detta ska vara orginalet men det är för tungdrivet.

Nå det är :inga som helst konstigheter med att vänta timmar på att filer ska öppnas, majoriten gör dock väldigt små saker inom allt. Ta excel så har jag lösningar som det tar över ett dygn att köra, medans andra inte förstår detta. Men det är som matematik där elever i grundskolan inte ser hur en matematisk uträkning på en dator kan ta en längre stund, då alla operationer som de i datorns miniräknare utför av typ 5+2 går snabbare än ett ögonblick.

Det låter ju som att I/O är helt/ganska/något/lite irrelevant här. Alla beroenden måste byggas upp" på nytt. Hur många objekt eller delar snackar vi om när man har fjorton timmar för att återskapa alla objekt?!

Skickades från m.sweclockers.com

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|