Allt är avvägningar, så även monolitisk vs chiplets!
Även om Intel inte lyckats bygga monolitiska kretsar med fler än 40 kärnor så finns det andra som byggt sådana med över hundra kärnor. Det mest aktuella exemplet är Ampere Altra (används i Microsoft, Googles ) som har 80 kärnor på en ~550 mm² krets och 128 kärnor på lite mindre än 100 mm² till.
Chiplets är mer något alla kommer gå till för de är tvungna nu när Moores "lag" är död. Fördelarna är flera, bl.a. ger det en bra väg till att bygga större och mer komplexa lösningar samt man kan göra det med mindre byggstenar som var för sig är enklare/billigare att tillverka.
Fördelarna med monolitiska designar är att de är mer energieffektiva och ger bättre prestanda per transistor. Ingen slump att AMD fortfarande använder sig av monolitiska designer för deras bärbara. Mobiler och andra kretsar som rejält optimeras för låg effekt och maximal perf/W lär vara de sista att gå till chiplets!
Nivån ovanför chiplets är ju flera CPUer och/eller flera GPUer. Även här har det uppenbarligen gått att göra en del optimeringar, Intel har samma core-to-core latens mellan CPU-sockets i Ice Lake SP som AMD Epyc "Milan" har mellan chiplets på samma sockel! Så där har Intel en "bakdörr" för att skala Xeon i nuläget, problemet med den skalningen är ännu sämre perf/W och ännu sämre perf/transistor jämfört med chipsets!
Sen är väl knappast Hyper Transport något krav för chiplets? Snabbaste, med råge, interconnect som existerar just nu är ju Apples "UltraFusion Interconnect". Den är ett par heltasfaktorer före närmaste konkurrent i bandbredd och det är (än så länge) den enda där man kan skala GPUer på compute-delen som chiplets.
Men även UltraFusion är en avvägning. Det är skitdyrt och begränsas till maximalt två kretsar i nuläget!