Lyssnar på varje ord som sägs i presentation hör man bl.a. "double the AI performance with full AVX-512 throughput". D.v.s. den stora nyheten är att AVX-512 nu fått 512-bitars intern data-path, mot tidigare 256.
Det förklarar rätt mycket varför vissa fall står ut så pass mycket mer än andra, de som använder AVX-512 kan i teorin se upp till x2 prestandavinst och i praktiken verkar det bli upp till 35 % (AES testet i GB5 är i praktiken en ren SIMD benchmark).
Förklarar också varför man specifikt valt ut ett test som text-processing i GB6, det testar
Klicka för mer information
Text Processing
The Text Processing workload loads numerous files, parses the contents using regular
expressions, stores metadata in a SQLite database, and finally exports the content to a different
format. It models typical text processing tasks that manipulate, analyze, and transform data to
reformat it for publication and to gain insights.
The input and output files are stored using an in-memory encrypted file system.
The workload is implemented using a mix of Python and C++. The workload uses the Python
3.9.0 interpreter and processes 190 Markdown files as its input.
Text Processing uses instructions that accelerate AES encryption and decryption (AES-NI and
VAES on x86 processors, ARMv8 AES on ARM processors).
Visa mer
Hade varit hundra gånger mer intressant om de bara skrivit GB6 ST prestanda, för väljer man ett test kan Apple med fog hävda att "IPC" ökade nära 100 % i M4 då prestanda i "Object detection" ökade >100 % (en del kommer från högre frekvens) p.g.a. att M4 fick SME som påminner väldigt mycket om Intels AMX (finns bara i Xeon), men finns även liknande acceleration i AVX-512 (Zen4 är långt snabbare än Zen3 i just detta test).
AMD sade specifikt att Zen 5 kommer vara världens snabbaste "consumer CPU". Antar att man inte räknar Ipad då, för väldigt svårt att se hur man kan slå M4 (och man kom ihåg att ta med M4 när man pratade TOPS...).
En intressant sak man inte nämnde, och det brukar alltid komma upp, var bättre perf/W. Undrar om det har att göra med detta
<Uppladdad bildlänk>
notera basfrekvensen. Den är 200 MHz lägre hos 9950X, 300 MHz lägre hos 9900X, 700 MHz lägre hos 9700X och 800 MHz lägre hos 9600X jämfört med motsvarande 7000-serie modell.
Så bara goda nyheter! Givet att man här fått upp prestanda 16 % på två år (det förutsätter att lägre basfrekvens inte betyder lägre faktiskt frekvens, vilket jag inte tror) medan Arm ökade ST-prestanda 36 % på ett år (enligt GB6) så känns framtiden för att ARM64 ska lyckas på Windows allt sannolikare