De senaste åren har antalet kärnor i entusiastprocessorer nått nya nivåer, grafikkorten har fått mer grafikminne och SSD-lagring på flera terabyte är inte längre världsomvälvande. Den mer kraftfulla hårdvaran öppnar dörrar till videoproduktion, renderingar och högupplöst spelande på hemmaplan, men ställt mot beräkningskraften som krävs för simuleringar och andra vetenskapliga beräkningar är det bara en droppe i havet.

Detta blev extra tydligt när Nationellt superdatorcentrum (NSC) mot slutet av mars lyfte täcket av Berzelius – Sveriges snabbaste superdator för AI och maskininlärning, som huserar vid Linköpings universitet. SweClockers packar väskan för att tillbringa en vårlik fredagseftermiddag med Nationellt superdatorcentrums tekniska chef Niclas Andersson, ett besök med fokus på hårdvara av episka proportioner.

Nationellt superdatorcentrum slog upp portarna år 1989 med Cray-signerade datorer i fokus, där det första förvärvet var Cray X/MP för 55 miljoner kronor. Cray Y/MP- och C90-modellerna tog dess plats under det efterföljande decenniet, för att år 2003 ersättas av egendesignade hårdvarusystemet Monolith. Organisationen har idag 37 medarbetare och är en fristående del av Linköpings universitet, som huserar i södra delen av campusområdet.

Vi börjar resan med ett besök i serverhallen Hangaren, som är hemvist åt färskingen Berzelius – ett beräkningskluster med extra högljudda fläktar och prestanda som med råge matchar ljudnivån. Under skalet syns nämligen 60 DGX-A100-lådor med paketstämpeln Superpod, som är signerad Nvidia. Varje delsystem är utrustat med åtta "Ampere"-baserade A100-grafikkretsar med 40 GB grafikminne vardera och därtill dubbla 64-kärniga Epyc 7742. Med grafikkortens SM-enheter och processorkärnorna adderade landar det totala antalet beräkningsenheter på omkring 60 000.

På baksidan av DGX-lådorna syns en rejäl uppsättning fiberanslutningar som svarar för kommunikation mellan servrarna och den extra lagringsenheten. Totalt handlar det om åtta 200- och två 100 Gbps-anslutningar per låda. Lagringens 32 anslutningar är på 200 Gbps och för att knyta samman all kommunikation har Berzelius 53 nätverksswitchar av 200 Gbps-typ, där varje switch har 40 portar.

Nämnda lagringsenhet består av fyra lådor fyllda med NVM Express-enheter och efter redundans erbjuder den 1 petabyte (PB) med total läs- och skrivhastighet om 192 respektive 136 GB/s. Varje låda har därtill 15 TB lokal NVM Express-lagring fördelat över åtta enheter – lika många som fläktarna som skickar sval luft över komponenterna.

Grafikkretsar per nod: Åtta Nvidia A100 med 40 GB HBM2-minne

Processorer per nod: Dubbla AMD Epyc 7742, totalt 128 kärnor

På baksidan känns även en tydlig värmeskillnad, som förklaras av att systemen vid belastning kan sörpla i sig 300 kW (300 000 W) – anledningen till 60 extra installerade elanslutningar ovanför serverskåpen. Nvidias nyckelfärdiga låda hålls sval med rejält fläktpådrag, men värmen baktill flyr lokalen genom kylvatten. Systemet är fortfarande under uppbyggnad och kyldörrarna är på gång, men det handlar kort och gott om rejäla radiatorer som kyler den heta luften och överför det till det vattenburna fjärrkylsystemet.

Fjärrkylningen används också för att hålla luften i lokalen sval genom värmeväxlare och cirkulerande luft. I Hangaren är upplägget öppet och varm- och kalluft blandas mer än i syskonhallen Kärnhuset, men med ett modulärt golv som medelst sugkopp modell större öppnas, kan extra luftflöde och vattenledningar med lätthet kopplas in vid serverskåpen.

Utgångspunkten till Berzelius är en donation på 300 miljoner kronor från Knut och Alice Wallenbergs stiftelse, men endast halva beloppet används för den nuvarande superdatorkonstruktionen. Framöver finns därmed utrymme för uppgraderingar, men i vilken form dessa väntas ske är lite tidigt att säga anser Niclas. Berzelius är nämligen det första systemet som NSC inte själva designar enligt egna principer, utan bakom prestandamonstret står Atos.

Även om valet på hårdvara inte är NSC:s eget finns det för AI-beräkningar inte någon som slår Nvidia på fingrarna i dagsläget och på papperet är prestandan sannerligen skyhög. Undertecknad kommer med intresse följa hur forskare hittar vägar att dra nytta av det nya verktyget, som utöver prestanda och nämnda fläktvrål verkligen sticker ut från mängden med guldglänsande frontpanelen.

Med mer servertypisk estetik finns ett flertal andra system i Hangaren, där stora resurser är dedikerade meteorologiska institut som Norska MET och svenska SMHI, en organisation som också har ohemula mängder data i NSC:s hallar. Omkring 18 PB är en siffra som nämns och mängden ökar hela tiden. För långtidslagring svarar magnetband, som sköts av en robot som organiserar och hämtar data från travar av band.

Syfte: Forskning och utveckling för MET Formfaktorer/antal nod: 2U/124, 4U/12 Antal kärnor: 4 352 stycken Maximalt effektuttag: 55 kW Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor Minne per nod: 96 GB DDR4 i 2U-format, 384 GB DDR4 i 4U-format Lokal lagring per nod: 240 GB SSD i 2U-format, 960 GB SSD i 4U-format Tillgänglig lagring: 1 PB

Syfte: Meteorologiska beräkningar för SMHI, MET och FMI Formfaktor/antal noder: 2U/508, 4U/12 Antal kärnor: 16 640 stycken Maximalt effektuttag: 213 kW Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor Minne per nod: 96 GB DDR4 i 2U-format, 384 GB DDR4 i 4U-format Lokal lagring per nod: 240 GB SSD i 2U-format, 960 GB SSD i 4U-format Tillgänglig lagring: 2 PB

Livslängden på en server ökar hela tiden i takt med att teknikutvecklingen avstannar något, men i dagsläget tecknas supportperioder om 5 år och det är således en lägstanivå för både lagrings- och beräkningsboxar. Det förstnämnda fallet byts främst för att diskar börjar rasa allt mer frekvent mot slutet av en sådan livstid och i högen för "utgående system" syns att uttjänt lagringsdensitet också är en faktor. Med 500 GB lagring på en hårddisk av 3,5-tumsformat är det svårt att försvara en plats i serverskåpen, när 14 TB finns att tillgå.

Olika generationer av servrar bjuder på olika lösningar för lagring, där ett mer modernt exempel är 60 separata 14 TB-diskar i två separata slädar med en mellanliggande server, vilka tillsammans får plats i en 4U-plats i ett serverskåp. Andra lösningar är tvåvåningsservrar, medan vissa fyller fronten med lagring. Hårddiskar är fortfarande mycket vanliga, men SSD-lösningar och snabbare SSD-baserade cache-servrar huserar också i i skåpen.

Efter genomgången av systemen är det dags att knäppa några bilder av Berzelius och grannarna, och glädjas en aning åt den nördiga detaljen att i binär ASCII skriva "AI" på sidopanelen till det nya systemet. Som boende och uppvuxen på östgötaslätten kan jag också glädjas över namnet Berzelius, som nu tar den gamle vetenskapsmannen från just Östergötland in i var nörds bakhuvud. Att det är en liten ordlek med Linköpings universitets förkortning, "LiU", gör inte saken sämre.

Vi kliver ut i vårvädret för den korta promenaden till serverhallen Kärnhuset, som med ett tak fullt av solpaneler lyckas tillgodose viss del av effektuttaget lokalt. Att täcka hela är dock en svår uppgift, eftersom hallen är hemvist åt flaggskeppet Tetralith – en hårdvarubjässe uppdelad i 1 908 noder med totalt 61 056 processorkärnor. Som namnet avslöjar rör det sig av iteration fyra av huvudsystemet, som alltså föregåtts av Mono-, Neo- och Triolith.

I Kärnhuset rådet en annan struktur än i Hangaren och Tetralith är placerad i tre korridorer där baksidorna tillika utblåsen görs i inkapslade rum, något som gör att varm- och kalluft på ett effektivt sätt kan hållas åtskilda. Bakom dörren mellan baksidorna på två av Tetralith-raderna råder ett klimat som närmast kan beskrivas som tropisk, kantat av passadvindarn nära orkanstyrka som grädde på moset.

Specifikationer Tetralith

Superdatorn består av totalt 1 908 noder konfigurerade på fyra vis. Forskare kan ansöka om beräkningskraft genom Swedish National Infrastructure for Computing (SNIC).

1 674 noder

Totalt antal kärnor: 53 568

Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor

Minne per nod: 96 GB DDR4

Lokal lagring per nod: 240 GB SSD

170 noder

Totalt antal kärnor: 5 440

Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor

Grafikkort per nod: Nvidia Tesla T4

Minne per nod: 96 GB DDR4

Lokal lagring per nod: 2 TB NVME-lagring

60 noder

Totalt antal kärnor: 1 920

Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor

Minne per nod: 384 GB DDR4

Lokal lagring per nod: 960 GB SSD

4 noder

Totalt antal kärnor: 128

Processorer per nod: Dubbla Intel Xeon Gold 6130, totalt 32 kärnor

Minne per nod: 384 GB DDR4

Lokal lagring per nod: 240 GB SSD