1. Nej, Cinebench är definitivt inte ett bra verktyg för att mäta "tunga" multi-trådade laster. Varför?
Hur "tungt" är något som använder en fraktion av tillgänglig kapacitet? Cinebench använder ca 1/4 av Zen, ca 1/8 av Skylake och mindre än 1/10 av SKL-X kapacitet.
Cinebench är, till skillnad från de flesta multitrådade program du hittar på skrivbordet, embarrassingly parallel. Sådana applikationer körs nästan alltid väsentligt mer effektivt på GPGPU alt. SIMD (vilket som är bäst beror på om bandbredd eller latens är primär flaskhals)
Cinebench är så extremt "embarrassingly parallel" att det skulle skala i princip perfekt om man så kopplade ihop två datorer via dial-up modem och delade upp jobbet vid körning. I princip inget annat program uppför sig på det sättet.
Och ditt "Black-and-white fallacy" pekar på att jag uppenbarligen inte var tydlig nog med vad jag avsåg. Den mest pragmatiska hållningen, givet vad de flesta tech-webbplatser faktiskt brukar testa (finns några trevliga undantag, som TechPowerUp och Phoronix), är att använda 720p testerna som proxy för "generell prestanda". Inte för att det är perfekt, utan för att det är minst dåligt givet förutsättningarna.
Jag skulle definitivt vilja se de saker jag listade, mycket för att spel inte är en bra proxy för dessa. Tyvärr är inget annat som normalt testat en bra proxy för dessa. I vetenskapliga program används t.ex. SIMD till väldigt nära 100 %, flera kärnor kan användas väldigt effektivt i vissa lägen (i lägen där man har väldigt stora dataset så det effektivt går att dela upp jobbet).
2. Vad är det som är den primära flaskhalsen i spel när det är CPU-bundet? Jo, kapaciteten hos CPUn att hantera skalära heltal. Det man ser är rätt stor andel villkorad körning, en hel del "pointer chasing" då spel normalt använder OOP med virtuella basklasser samt väldigt hög "temporal locality".
Vad ser du hos kompilering, hos webbmotorer, hos MS Office etc? Rätt mycket exakt samma sak. Har du en Intel CPU kan du mäta exakt hur mycket varje del av CPUn är lastad, du kan mäta cache-missar/träffar, mängd felspekulerade hopp och även få ett exakt mått på genomsnittlig IPC (i x86 instruktioner per tidsenhet som "retires").
Spel är inte helt identisk med t.ex. MS Office, men det är väldigt mycket närmare än Cinebench (som primärt jobbar med skalära flyttal, har i princip noll cache-missar och nästan igen villkorad körning alls ) eller komprimering (som beror av minnesbandbredd på ett sätt nästan inget annat beror av, L4$ i 5775C hjälper rejält här men är i princip irrelevant i andra fall, för spel ger L4$ samma effekt som RAM med extremt låg latens).
Peka gärna på något annat som t.ex. SweC mäter som är en bättre proxy än spel. TechPowerUp mätte tidigare just viruscanning, kolla hur det uppför sig på olika CPUer. Kolla sedan hur det såg ut i 720p spel...
Spel är ingen prefekt proxy för att avgöra t.ex. hur bra CPUn hanterar JS-motorn i webbläsaren (och numera allt fler applikationer då t.ex. Visual Studio Code är utvecklat med en JS-motor som grundpelare). Felet är dock inte vilka delar av CPUn som används, det är hyfsat snarlikt. Felet är JS än så länge inte har något koncept av flera trådar (men finns fulhack för att få till det), så enkeltrådprestanda är långt viktigare för webbläsaren jämfört med vad det är i spel.
3. Hur är detta ett problem? Vad man måste tänka på här är att spelutvecklare testar i praktiken bara sina titlar med kombinationen: CPU som är så pass stark att flaskhalsen nästan aldrig hamnar där. Finns exempel på spel som uppför sig rätt illa trots att man till stor del fortfarande är GPU-bunden, ofta ser man det i pissiga lägsta FPS trots att genomsnittlig FPS är på en väldigt hög nivå (hög nog för att ofta vara GPU-bunden).
Vill man ha en optimal spelupplevelse ska man se till att ha ett så main-stream balanserat system som möjligt. Det har under väldigt lång tid varit system som är kraftigt GPU-bundna i normalfallet.
Siktar man på 60 FPS fungerar absolut i3-8350K/R5-1600, siktar man på högre FPS bör man skaffa mer CPU-kraft. Alla kör inte på "ultra". Ultra innehåller ofta ett par hjärndöda effekter som rejält kapar FPS utan att ge speciellt mycket bättre resultat. Kör man spel som Fortnite och liknande är det inte alls ovanligt att köra "medium" för att nå >100 FPS även med rätt mediokra GPUer, i det läget krävs rätt mycket CPU-kraft!