Apples A12 slår i7-4790K och R7-1800X i enkeltrådprestanda...

Permalänk
Hedersmedlem
Skrivet av Yoshman:

Projektet gick under namnet K12 och är endera nedlagt eller ligger i alla fall i malpåse.

Finns rykten om att en orsak till att Keller slutade var att han inte var överens med AMDs ledning kring satsningen på ARM. Tanken från början var att mikroarkitekturen i Zen skulle användas på för x86 och ARM64, "enda" som behövs är två olika front-end implementationer.

Jämför man Apples Swift (som jag är rätt säker Keller jobbade på under sin tid på Apple) och Zen så finns rätt mycket likheter! Hade varit väldigt kul att se K12 och Zen sida vid sida. K12 hade med 100 % säkerhet presterat bättre, frågan är bara hur mycket bättre.

Intressant tanke: Vad är det som hindrar att en processor (kanske en Zen, kanske en Intel) skulle ha två olika frontends samtidigt? Som det går att växla mellan. Ungefär som att växla mellan 32-bitars och 64-bitars läge. Alltså, något man skulle göra på processnivå i operativsystemet.

Du skulle alltså kunna kompilera om ett program till en ARM-binär och plötsligt så skulle du kunna köra ARM-program snabbare än motsvarande x86 eller x64-program utan att för den sakens skull vara långsammare på x86/x64?

Permalänk

Ja Apples SoC är sannerligen imponerande och de gör utan tvekan den bästa ARM baserade SoC:en på marknaden. Om nu ARM ska slå ut x86 så måste det däremot finnas produkter med ARM för att det ska hända och OEM tillverkarna verkar inte så intresserade av det än. Det räcker med att titta på always connected pc kategorin som inte verkar ha fått något större genomslag än. Det krävs nog att Apple ger upp x86 helt och går över till sina egna kretsar eller att Microsoft släpper en Surface med Snapdragon SoC för att det ska börja hända saker.

Visa signatur

Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti
Xiaomi Poco X3 Pro I Nvidia Shield TV V2 I PS4 I

Permalänk
Medlem
Skrivet av Wasp:

ja det var ju faktiskt rätt sjukt! 50x mindre effekt men fan så mycket högre IPC är rätt grymt!

Håller med snacka om att tekniken har gått framåt med dessa cpuer i mobilerna på bara 5 år

Visa signatur

╔ Corsair 32GB DDR4 CL15 3000Mhz VENGEANCE RGB ■
╠ ASUS-ROG-MAXIMUS-X-HERO ■ ASUS-ROG-STRIX-RTX2070-OC ■ i7 8700K
╠ DeepCool Captain 280EX RGB ■ 2x Samsung 970 EVO 500GB■
╠ Deepcool NEW ARK 90 Electro Limited Edition NR58 ■ XFX PRO1000W Limited Black Edition
╚ Samsung SE790C 34" Ultrawide 3440x1440@75Hz

Permalänk
Datavetare
Skrivet av pv2b:

Intressant tanke: Vad är det som hindrar att en processor (kanske en Zen, kanske en Intel) skulle ha två olika frontends samtidigt? Som det går att växla mellan. Ungefär som att växla mellan 32-bitars och 64-bitars läge. Alltså, något man skulle göra på processnivå i operativsystemet.

Du skulle alltså kunna kompilera om ett program till en ARM-binär och plötsligt så skulle du kunna köra ARM-program snabbare än motsvarande x86 eller x64-program utan att för den sakens skull vara långsammare på x86/x64?

Finns flera CPU-modeller med två front-ends. Ett väldigt närliggande exempel är alla ARM modeller som stödjer både 32-bitars ARM och 64-bitars ARM, även om många instruktioner ser snarlika ut i assembler har de inte alls samma binära representation.

Problemet med en CPU med kombinationen x86_64 + ARM64 (egentligen Aarch64) är att front-end på en high-end x86 äter väldigt med transistorer!

Apples A12-systemkrets är runt 80-85 mm², det inkluderar då en relativt kompetent GPU och en kiselmässigt ungefär lika stor "NPU" (network processing unit).

Enligt AnandTechs mätningar i bilden ovan är tar de två Vortex kärnor plus de fyra små kärnorna (Tempest) 12 mm², det inklusive cache. "Små" kärnor är här rätt mycket inom citationstecken då AnandTechs uppföljande artikel konstaterar att dessa har högre IPC än ARM Cortex A73 som i sin tur ligger någonstans mellan dagens Atom och Zen/Skylake (Atom är inte alls var det en gång i tiden var, IPC är numera på Core2 nivå).

Ett CCX tar, enligt AMD, 44 mm². Det är det är alltså fyra kärnor mot Apples kärnor. I båda fallen är CPU-cache inräknat. D.v.s. trots att Apple har en långt bredare front-end och en långt bredare back-end tar det mindre yta än vad ett CCX kommer ta även om det blir "perfekt" skalning (säger inte TSMC upp till 60 % högre densitet för icke SRAM?)

Sedan finns det andra saker. Aldrig tänkt på varför både Intel och AMD stannat på 32 kB L1D$?

Orsaken är att L1D$ är extremt latenskritiskt, om man ser till att varje "grupp" (cache set) i cachen är exakt 4 kB så kan man slå upp i L1D$ parallellt med uppslagningen av virtuell-till-fysisk mappning (cache som kallas TLB).

Man vill inte gärna ha mer än 8 grupper i en L1$ cache, ju fler grupper ju mer ström drar det! Vidare kan man bara göra tricket med parallell uppslagningen om varje grupp är lika stor (eller mindre) än en adress-sida (page), som på x86 är 4 kB i normalfallet. Finns även 2 MB adress-sidor, men det fungerar inte att rent praktiskt att bara köra dessa så man är fast med 4 kB.

ARM stödjer 4 kB, 16 kB samt 64 kB. Apple har droppat stödet för 4 kB, vilket betyder att man kan ha en 8 gruppers L1$ på 128 kB och ändå stödja parallell uppslagning av TLB. Kan bara göras på x86 om man bryter bakåtkompatibilitet.

Vidare: x86 specificerade sin minnesmodell i en tid när multicore knappt fanns. Måste finnas en väldigt exakt definition av vad olika CPU-kärnor kan förvänta sig när det kommer till läsning/skrivning mot RAM. x86 har en extremt "strikt" minneskonsistensmodell -> enkelt för människor att resonera kring, men värdelöst när det kommer till optimeringspotential (något Nvidia Jensen brukar framhålla, GPUer ligger på andra extremen, extremt "lös" minneskonsistensmodell).

64-bitars ARM har en minneskonsistensmodell som är en perfekt match till vad bl.a. C++, Java och C# förväntar sig -> multitrådade program blir mer optimalt. Frågan är hur enkelt/effektivt det skulle bli att designa en back-end som både hanterar ARM och x86.

AMD tänkte ju göra just det med Zen, d.v.s man tänkte designa två CPUer med i princip samma back-end. Det var alltså två separata kretsar, inte en med två front-ends. ARM64 varianten hade kodnamnet K12, men lanserades aldrig. Frågan är om man stötte på tekniska problem eller om man bara insåg att det skulle försämra fokus?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Lite tidiga ryktade siffror från A12X som sitter i Apples nya Ipad Pro-serie.
https://wccftech.com/ipad-pro-benchmarks-as-fast-as-macbook-p...

Permalänk
Medlem
Skrivet av Fulci:

Lite tidiga ryktade siffror från A12X som sitter i Apples nya Ipad Pro-serie.
https://wccftech.com/ipad-pro-benchmarks-as-fast-as-macbook-p...

Fina priser på nya Ipad Pro
https://www.webhallen.com/se/campaign/7662-iPad-Pro

Undrar vad en spelkonsol från Apple med en A12X skulle kosta, 8-9000?

Permalänk
Medlem
Permalänk
Medlem
Skrivet av Yoshman:

Nu är detta bara en enda benchmark, men jobbar en hel del med ARM och Geekbench 4 är faktiskt en riktigt bra mätare för CPU-prestanda i alla de fall där jag kunnat verifiera motsvarande CPU på en traditionellt Linux-system.

T.ex. stämmer Cortex A75 resultatet i Geekbench mycket väl överens med vad jag sett själv. Samsung Galaxy S9/S9+ med Snapdragon 845 har i praktiken just en Cortex A75. Qualcomm kallar CPUn för "Kryo 280 Gold" men den i det närmaste identisk med ARM Cortex A75.

Apples Bionic A12 verkar kunna klockas till 2,5 GHz. Rent teoretisk kan denna CPU-design köra 50 % fler instruktioner per cykel än vad Haswell och Zen mäktar med. Det har Apples CPUer kunnat göra ända sedan A7 (Cyclone), sedan dess verkar man ha putsat på detaljerna.

IPC ökningar har definit börjat droppa av för Apples del de senaste två släppen, men det kanske inte är så förvånande då man numera verkar ligga ~40 % högre i IPC jämfört med Skylake!

Är väl medveten om att 64-bitars ARM är väsentligt bättre designad jämfört med x86_64, men hade nog inte riktigt förvänta mig att Apple skulle springa ifrån x86-gänget så här mycket. Detta lovar väldigt gott inför kommande lansering av Cortex A76 och dess efterföljare.

Är allt mer övertygad att 64-bitars ARM kommer börja slå ut x86 på laptops och i förlängningen även stationära samt servers, bara en tidsfråga. Ju mer kretstillverkningen fastnar på en viss tillverkningsnod, ju större fördel kommer det bli för ARM att deras ISA är i det närmaste perfekt designad. Det medan x86 primärt designades på 80-talet med krav som idag är helt annorlunda.

A12 vs i7-4790K
A12 vs R7-1800X

Måtte nu bara nästa generations konsoler köra 64-bitars ARM, då kan vi åter igen få en generation konsoler som i alla fall initialt kan utmana de snabbaste PC-riggar i CPU-prestanda (GPU-prestanda lär inte riktigt gå att matcha p.g.a. pris och effekt).

Nu är vi snart där! Apple avvecklar sina beroende av x86, eller?

Skickades från m.sweclockers.com

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Datavetare
Skrivet av sAAb:

Nu är vi snart där! Apple avvecklar sina beroende av x86, eller?

Allt annat vore väldigt osannolikt.

Fråga är hur lång tid det tar för PC-sidan att få vettiga alternativ baserat på 64-bitars ARM. Ser hellre att min nästa laptop kör 64-bitars ARM (och helst Linux) än att det blir ännu en x86 modell.

Men är pragmatiskt här. De ARM-laptops som finns ute nu är löjligt låsta till Windows, fortsätter det får man nöja sig med x86

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer