AMD gör monsterprocessor med 16 kärnor, inbyggd grafikdel och HBM-minne

2015-04-12 13:22

Medlem

Registrerad: Sep 2014

●

Skrivet av Yoshman:

Xeon E5 finns i varianter upp till 4-sockets, 4xxx modellerna, medan Xeon E7 finns upp till 8-sockets. Men allt över 2-sockets är extrema nischprodukter så verkar som dessa produkter inte uppdateras varje CPU-generation. Sedan gäller dessa begränsningar bara om man kör med QPI, både Intels och AMDs server CPUer kan använda 3:e-parts teknik som t.ex. NUMALink för att bygga massiva system som fortfarande är cache-koherenta. I Intel-fallet använder man typiskt Xeon E5 i stället för E7 av kostnadsskäl, t.ex. SGIs UV-serie som finns i varianter med upp till 256 CPU-sockets.

Gå till inlägget

Men de här SGI servrarna med flera 100 sockets är ju rena nischprodukterna som inte går att använda till nånting vettigt, förutom vetenskapliga beräkningar. De är inte general purpose datorer, det existerar tex inga business benchmarks, ERP såsom tex SAP benchmarks, eller databas relaterade TPC benchmarks. De enda benchmarks som existerar är embarassingly parallel benchmarks, av typen klustrade beräkningar. Väldigt nischat, och inte många kommersiella företag har användning av rena beräkningsservrar. Företag vill ha general purpose servar, som faktiskt klarar av att producera SAP benchmarks och benchmarks på andra affärssystem.

Däremot verkar den här cpun trevlig, med 32 cores, och upp till 64 TB ram, som kommer om några månader. Den är bl.a. helt immun mot heartbleed. Den är inte 20% snabbare än föregångaren (som har flera rekord) utan är 3-4x snabbare.
http://www.enterprisetech.com/2014/08/13/oracle-cranks-cores-...
http://www.theinquirer.net/inquirer/news/2373412/oracle-says-...

Denna nya Zen AMD cpu verkar också kunna ge ett rejält lyft och vara mycket snabbare än tidiagre cpuer. Intels nya cpu är ju typiskt 5-10% snabbare än sin föregångare som den ersätter, vilket är ganska dåligt, om man tänker efter. Ifall du har en gammal Q6600 så finns det knappt någon anledning att köpa senaste Intel cpun idag. Överklocka lite, och du är ifatt Intels nyaste. Nej, det är ju AMD som är innovativa nu. Den här cpun lär krossa Intels cpuer.

Rapportera Redigera

Citera flera Citera

2015-04-12 16:14

Permalänk

GilbertG

Medlem ★

Plats: Malmö
Registrerad: Dec 2004

●

Min spontana reaktion:

Visa signatur

Räkna ut hur kraftigt nätaggregat du behöver på OuterVision Power Supply Calculator. 500W räcker för de allra flesta vanliga system. Seasonic är bäst. ;) – Elektrostatisk urladdning är ett verkligt problem.
"People who are serious about software should make their own hardware" – Alan Kay
Bojkotta maffian

Rapportera Redigera

Citera flera Citera

2015-04-12 17:02

Permalänk

JOANATAN5354

Medlem

Registrerad: Okt 2014

●

Zen 16 cores och r9 490x ?

Visa signatur

Ursäktar för stavfel

Rapportera Redigera

Citera flera Citera

2015-04-12 18:22

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av MichaelJackson:

Men de här SGI servrarna med flera 100 sockets är ju rena nischprodukterna som inte går att använda till nånting vettigt, förutom vetenskapliga beräkningar. De är inte general purpose datorer, det existerar tex inga business benchmarks, ERP såsom tex SAP benchmarks, eller databas relaterade TPC benchmarks. De enda benchmarks som existerar är embarassingly parallel benchmarks, av typen klustrade beräkningar. Väldigt nischat, och inte många kommersiella företag har användning av rena beräkningsservrar. Företag vill ha general purpose servar, som faktiskt klarar av att producera SAP benchmarks och benchmarks på andra affärssystem.

Gå till inlägget

Det är sant att allt över dual-socket system är extrema nischprodukter, men det är helt fel att SGIs UV-serie inte kan användas till något annat än vetenskapliga beräkningar. Faktum är att få lär använda UV-serien som beräkningskluster då bl.a. SGI själva har andra produkter just för scale-out scenarion som ger betydligt högre beräkningskraft per Watt och krona, här finns t.ex. SGI ICE.

SGI UV är specifikt utvecklad just för saker som SAP och andra tillämpningar där man behöver ett cache-koherent system med massiv mängd RAM (finns UV-system i drift med upp till 64TB RAM) och massiv mängd CPU-kärnor. Vad man typiskt vill åt i dessa system är möjligheten att ha riktigt stora databaser helt eller till stor del i RAM.

Inte heller sant att det inte finns business benchmarks på SGI UV, tvärt om har dessa system visat sig kunna prestera bättre än något IBM och Oracle kunnat uppbringa, oavsett prislapp: SGI® Altix® UV 1000 World's Most Powerful Enterprise Java Application System.

Det som är kritiskt för enterprise-applikationer är att systemet skalas vertikalt (scale-up) och SGI UV skalar just på den ledden. Den tekniska detaljen för om något är "scale-up" eller "scale-out" är huruvida man adderar mer resurser till ett enskilt system (scale-up) eller om man adderar mer resurser till en samling system (kluster av system, scale-out).

Läs den artikel du själv länkar, andra generationen av det interconnect som används i SPARC M6/M7, Bixby, stödjer både "scale-up" (cache-coherent NUMA) och "scale-out" (system som saknar cache-koherens där interconnect i praktiken är ett snabbt nätverk)

"Interestingly, the updated Bixby NUMA interconnect will allow for cache coherent links between the Sparc four-socket nodes and will also allow for non-coherent links. This will allow a big Sparc M7 machine to function as a cluster for Oracle RAC database clustering software, using the Bixby interconnect instead of 40 Gb/sec InfiniBand as the Exadata database clusters do."

Tidiga versioner av NUMALink hade relativt hög latens, något som fick det sådana system att inte riktigt vara samma sak som multisocket-system via QPI eller liknande. Jämför man första generationen Bixby med NUMALink6 (både dessa är "last-gen", fokus för NUMALink7 är just minskad latens) så har Bixby en genomsnittlig latens på ca 150ns (enligt artikel du länkade) och NUMALink6 ligger på ca 100ns. Så SGI-UV är på alla sätt ett ccNUMA-system väldigt likt vilket multisocket system som helst, fast på en helt annan skala.

Skrivet av MichaelJackson:

Däremot verkar den här cpun trevlig, med 32 cores, och upp till 64 TB ram, som kommer om några månader. Den är bl.a. helt immun mot heartbleed. Den är inte 20% snabbare än föregångaren (som har flera rekord) utan är 3-4x snabbare.
http://www.enterprisetech.com/2014/08/13/oracle-cranks-cores-...
http://www.theinquirer.net/inquirer/news/2373412/oracle-says-...

Gå till inlägget

Intel har motsvarande teknik i kommande Skylake, MPX, och stöd för dessa finesser har redan integrerats i glibc och i Linux sedan 3.19.

Skrivet av MichaelJackson:

Denna nya Zen AMD cpu verkar också kunna ge ett rejält lyft och vara mycket snabbare än tidiagre cpuer. Intels nya cpu är ju typiskt 5-10% snabbare än sin föregångare som den ersätter, vilket är ganska dåligt, om man tänker efter. Ifall du har en gammal Q6600 så finns det knappt någon anledning att köpa senaste Intel cpun idag. Överklocka lite, och du är ifatt Intels nyaste. Nej, det är ju AMD som är innovativa nu. Den här cpun lär krossa Intels cpuer.

Gå till inlägget

Du jämför Intel desktop med en server CPU. För skrivbordet ger det inte speciellt mycket att kliva förbi två CPU-kärnor för majoriteten, redan med Core2 hade Intel den CPU-design med bäst enkeltrådprestanda och om något har man drygat ut den ledningen idag. Att öka enkeltrådprestanda är långt svårare än att öka totala beräkningskapaciteten i en krets genom att addera kärnor.

Tittar man på utvecklingen på Xeon sedan Core2 så är dagens snabbaste Intel system (QPI-baserade) mellan 50-100 gånger snabbare (lite beroende på arbetslast) än den snabbaste Core2 baserade Xeon-systemet. Enbart införandet av DDIO i Sandy Bridge gav runt en fördubbling i många I/O-intensiva laster. Om Intel i det närmaste stått still, hur kommer det sig då att Xeon E5 v3 (Haswell) vid lansering i höstas var det snabbaste single- och dual-socket system i en lång rad enterprise benchmarks, framförallt om t.ex. SPARC Niagara ökar sin prestanda flera gånger per generation?

Att Oracle överhuvudtaget kan bygga ett system med 32-kärnor beror enbart på att SPARC S3 kärnan har mer gemensamt med AMD Jaguar och Intel Silvermont (alla 3 är relativt enkla dual-issue designer) än med IBM POWER8 (8-issue) och Intel Haswell/Broadwell (5-issue). Cavium Networks hade ett 32-kärnors MIPS-baserat system för nära nog 10 år sedan, det var möjligt då varje kärna var väldigt klen jämfört med samtida PowerPC och x86. Enkeltrådprestanda på POWER8 och Haswell är ju så långt före SPARC S3 att Oracle insett att T-serien är meningslös och man har därför skrotat den (står också i artikeln du länkat).

POWER8 har maximalt 12 kärnor, men bandbredd per socket är långt högre än både Intel Xeon E5/E7 och även än SPARC M7 (160GB/s med DDR4 jämfört med POWER8 230GB/s med DDR3!). Med den prestanda per CPU-kärna POWER8/Haswell har räcker inte bandbredden till om man skulle skala upp systemen till 32 kärnor. I Xeon fallet är det i de flesta fall ingen poäng att gå över 10/12 kärnor om målet är "enterprise"-applikationer, 18 kärnors varianten är främst riktade mot HPC där inte bandbredd utan beräkningskraft och FLOPS/W är den största flaskhalsen.

Det verkar som det behövs ungefär dubbelt så många SPARC S3 kärnor som POWER8/Haswell för att man ska ha ungefär samma beräkningskraft (givet att alla kör på ungefär samma frekvens). Så ur perspektiv som CPU-tekniknörd är SPARC Niagara en rätt ointressant CPU, det är en massa högt klockade Jaguar/Silvermont med brutal bandbredd, d.v.s. det är en microserver som är rejält "scaled-up" vilket är lite udda då typiska microserver-laster brukar fungerar bra att använda "scale-out" som är betydligt billigare än "scale-up". Som CPU är Haswell/Broadwell/POWER8 alla extremt tekniskt intressanta, Intel leder enkeltrådprestanda medan POWER8 har mer prestanda per fysiska kärna när alla 8 trådar användas fullt ut. Här får man hoppas att också Zen slår sig in och blir något som ur ingenjörssynpunkt är fascinerande att bara läsa om!

Edit: I just Oracles fall är det naturligtvis just databaser man fokuserar på, det är en arbetslast som passar en rejält uppskalad microserver (som passar väldig bra till många typer av disk-intensiva laseter) med massiv mängd RAM och bandbredd (så stora delar av databasen kan ligga cachad i RAM).

Senast redigerat 2015-04-12 19:26

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (5)

2015-04-12 21:26

Permalänk

CGI

Medlem ★

Plats: Sverige
Registrerad: Mar 2007

●

Tvivlar på att Intel förlorar.

http://www.tweaktown.com/news/44543/intels-new-xeon-phi-feature-128-threads-support-384gb-ddr4/index.html

Skickades från m.sweclockers.com

Visa signatur

Lead 3D Artist, Sweden
Xeon Gold 6246R, 2x Nvidia RTX A5000 24 GB + NVLink, 384 GB ECC RAM

Rapportera Redigera

Citera flera Citera

2015-04-12 21:49

Permalänk

Fakkahe

Medlem ★

Plats: Värnamo
Registrerad: Jul 2010

●

Skrivet av CGI:

Tvivlar på att Intel förlorar.

http://www.tweaktown.com/news/44543/intels-new-xeon-phi-feature-128-threads-support-384gb-ddr4/index.html

Skickades från m.sweclockers.com

Gå till inlägget

Undrar hur mycket den kommer kosta, säkert något på $13337

Visa signatur

CPU: I5 4690K @ 4.8GHZ Vcore 1,32 Temp max load: 76c | KYLARE: Phanteks PH-TC14PE MODERKORT: ASUS Z97-A | PSU: FSP Hyper 700W
MINNE:16GB HyperX Black @ 1866mhz |SSD: PNY Optima 240 GB
GRAFIK KORT: Gigabyte 970 GTX WFx3 | BURK: Phanteks Enthoo Pro, windowed edition
Ja jag vet att jag särskriver och jag skyller på engelskan!

Rapportera Redigera

Citera flera Citera

2015-04-12 22:08

Permalänk

Zotamedu

Entusiast ★

Plats: Göteborg
Registrerad: Dec 2005