Intel lanserar Clover Trail+ för smarta telefoner

2013-02-25 20:38

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Cove:

Frågan är om intel kan ha samma låga tdp på sin nya atom processor som på den gamla enkel kärniga, återstår att se.

Intel är grymma på cache design, lång erfarenhet. Dock så tror jag inte de är 10 år före... för 10 år sen så var det Pentium 4 och Pentium M tiden, med cache:s designade i 130nm storleken. Har svårt och tro att de fortfarande hade bättre latency än moderna ARM processorer.

Också lite synd att inte senaste S4:an inte var med i alla stapel diagram (så man kunde se förbättringen mellan ARM generationerna).
Nya Qualcomm 600 processorn verkar ju krossa i prestanda jämfört tillockmed ifrån den väldigt snarliga S4 Pro. Så ett nytt uppdaterat test med alla moderna plattformar hade jag gärna sett innan jag dragit några slutsatser.

Just Multi-threading efficiency är ju "native kod" = teoretisk performance (iaf android räknat), och som de skriver för intel SoC:en så är det ju till stor del för att du kör 2 trådar på processor kärna (därmed delad cache på båda trådarna såklart) samt deras väldigt grymma cache design överlag.

Tittar man på Java JVM virtualisation performance som faktiskt är den faktiska prestandan du får ut av en android telefon så ser det väldigt annorlunda ut,
"Java code is Atom's achille's heel: integer performance is 40% slower than its direct competitor (S3/MSM8660) - this is the kind of code apps use for the most part. Floating-point (FP32) does much better - thanks to the relatively more powerful FPU x86 brings."

Dock så är ju testet ganska utdaterat, är säker på att senare version av dalvik ökar intel prestandan markant under JVM.

Nu skall ju inte nya intel processorn tävla emot s4 Pro längre, utan det är ju Snapdraon 600, 800 och så småningom Exonys Octa..

Vi får hoppas Anand Tech (eller någon annan) gör ett test på alla moderna SoC's under en senaste Dalvik, endast då kan vi faktiskt se hur prestandan ser ut mellan de olika arkitekturerna.

Jag tror nya clovertrail ligger närmre s4 pro än den 600/800/Octa... men kommer bli intressant och se (nån lär ju göra ett uppdaterat test snart)

Utöver prestanda, prestanda/effekt så har ju x86 på Android en stor nackdel, och det är ju att trots att man skall köra emot JVM så finns det fortfarande en hel del apps som kallar native arm libraries vilket resulterar i -> "not supported by your device" fel för intel SoC:arna.. det är ju lite tråkigt

Dold text

Gå till inlägget

Ok, hade fel. ARM är mer än 10 år efter Intel i L2 cache design. För 10 år sedan hade Intel Pentium M och P4 som hade L2 caches med latenser kring 20-30 cykler (idag är det runt 10 cykler) medan ARM har runt 40 cykler till L2. Rätt kommentera skulle vara att AMD ligger runt 10 år efter i L2 cache design (Piledriver har en 2M cache på ~20 cykler latens, vilket matchar Pentium M rätt bra), och AMD i sin tur ligger långt före ARM.

Sedan tror jag inte TDP blir ett problem för dual-core Atom då Clover Trail (dual core Atom) har en TDP på <2W (många hävdar 1.7W) vilket är betydligt lägre än många ARM SoCer som ligger runt 4W TDP.

Det test jag länkade till refererar till Android 2.3. Håller på att skapa en Dalvik benchmark baserad på de Java program som finns på denna site men kan säga redan nu att Davik prestanda verkar ha förbättrats rätt rejält för x86 till Android 4.0. Kommer släppa denna benchmark gratis när den är klar.

Vad det gäller NDK applikationer så har Intel skapat en infrastruktur som automatiskt konverterar ARM-maskinkod till x86-maskinkod. Detta sker helt automatiskt i "molnet", har laddat ner en hel del spel till min Medfield telefon (och många av dessa använder NDK) och än så länge har precis var enda spel fungerat. Så det blir inga "not supported by your device" fel, du får gärna peka på något program som jag ska testa.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (6)

2013-02-25 20:49

Permalänk

_SpaxX_

Medlem

Plats: Lidköping
Registrerad: Okt 2007

●

Skrivet av Gramner:

Få applikationer på mobiltelefoner använder multipla trådar i någon större omfattning så bra single-thread prestanda är det viktigaste.

Gå till inlägget

Oki thanks for the heads up! =D

Visa signatur

Intel 5820K~3,3GHZ+/ASUS X99-S/2 st R9 290 CF/Crucial DDR4 2133MHz 16 (4x4)/ANTEC HCG-900 PSU/AeroCool Hitech 7 chassi

Rapportera Redigera

Citera flera Citera

2013-02-25 21:08

Permalänk

Gramner

Medlem ★

Registrerad: Nov 2004

●

Skrivet av rektor:

Dom borde använda egen in-house grafikdel istället för PowerVR grafik, då Imageon Technologies suger och vägrar släppa dokumentation för drivrutinsutvecklare.

Gå till inlägget

Kommer i Bay Trail.

Visa signatur

Assembly är ett högnivåspråk.

Rapportera Redigera

Citera flera Citera

2013-02-25 21:45

Permalänk

boomhowler

Medlem

Registrerad: Okt 2011

●

mm mums, lite Ubuntu phone på en sådan här kan vara intressant.

Rapportera Redigera

Citera flera Citera

2013-02-25 23:07

Permalänk

Murmelmuff

Medlem

Plats: Göteborg
Registrerad: Maj 2011

●

Skrivet av IQTRM:

Detta kombinerat med nån slags dockningslösning så som Ubuntu visade häromsistens eller Asus dockningsplatta och vi har en så gott som fullfjädrad dator i fickan.. då börjar vi prata mobilt kontor.

Gäller väl bara att Apple tar idén och marknadsför den så som bara de kan för att det ska vara en standard till om 3 år ute i företagen.

Gå till inlägget

Do want. Det är där framtiden ligger. Du köper en Windows 8/Android/Ubuntu telefon och sätter den i en docka som är inkopplad till din skärm och sen kör du Windows 8/Chrome OS/Ubuntu. Perfekt att ha på jobbet.

Jag vill ha en docka med bluetooth så att jag kan ha mus+tangentbord trådlöst, en SSD för lagring och Leap Motion.

Rapportera Redigera

Citera flera Citera (1)

2013-02-25 23:15

Permalänk

Cove

Medlem ★

Plats: Malmö
Registrerad: Dec 2003

●

Skrivet av Yoshman:

Ok, hade fel. ARM är mer än 10 år efter Intel i L2 cache design. För 10 år sedan hade Intel Pentium M och P4 som hade L2 caches med latenser kring 20-30 cykler (idag är det runt 10 cykler) medan ARM har runt 40 cykler till L2. Rätt kommentera skulle vara att AMD ligger runt 10 år efter i L2 cache design (Piledriver har en 2M cache på ~20 cykler latens, vilket matchar Pentium M rätt bra), och AMD i sin tur ligger långt före ARM.

Sedan tror jag inte TDP blir ett problem för dual-core Atom då Clover Trail (dual core Atom) har en TDP på <2W (många hävdar 1.7W) vilket är betydligt lägre än många ARM SoCer som ligger runt 4W TDP.

Det test jag länkade till refererar till Android 2.3. Håller på att skapa en Dalvik benchmark baserad på de Java program som finns på denna site men kan säga redan nu att Davik prestanda verkar ha förbättrats rätt rejält för x86 till Android 4.0. Kommer släppa denna benchmark gratis när den är klar.

Vad det gäller NDK applikationer så har Intel skapat en infrastruktur som automatiskt konverterar ARM-maskinkod till x86-maskinkod. Detta sker helt automatiskt i "molnet", har laddat ner en hel del spel till min Medfield telefon (och många av dessa använder NDK) och än så länge har precis var enda spel fungerat. Så det blir inga "not supported by your device" fel, du får gärna peka på något program som jag ska testa.

Gå till inlägget

Man kan inte bara räkna cache design i latency, latencyn när det gäller cache står i direkt proportion till mängden minne. När Intel gick från prescott 1MB-2MB cache så ökade latencyn ifrån 21 till 27 cykler nått sånt. L1 cache som är väldigt liten ligger på en latency på 3-4 typiskt sett.
Och det är såklart mer parametrar en latency och minnes mängd som påverkar hur avancerad en cache är (bandbredd är en t.ex. )

Har väldigt svårt och tro att Intel ligger 10 år före ARM (eller AMD) i cache design. Räknar du även in branch predicting till "cache features" så ligger de ju definitvt inte 10 år före.

Hittar du någon studie som du kan länka till ? Enda rejäla försprånget det alltid pratas om är ju intels tillverkningstekniska försprång, hade de legat 10 år före i cache design (med tanke på hur viktig del det är i en modern processor) så hade det uppmärksammats mer.

Atom processorn må ha en ganska kort väg till cachen med låg latency men har o andra sidan 1MB (2x512), men ARM 15 kan ha upp till 4MB cache..

Atom har arkitekturen har inte direkt gett några generella prestandaökningar de senaste 5 åren, utan Intel har fokuserat att få ner effektförbrukningen, jämför man prestandan mellan A15 och Atom Dualcore, så ser A15 snabbare ut på det test som Anand Tech gjort.
Anandtechs jämförelse
Det är emot exynos dual core. enligt Anand så är Cortex A15 ca 40-65% snabbare i CPU testet (emot dualcore atom 1.6GHz)

Här är en annan artikel som jämför A15 emot Atom
http://www.extremetech.com/computing/139393-arm-cortex-a15-ex...

Anand verkar även skrivit lite om nya Atom släppet:
http://www.anandtech.com/show/6790/intels-clover-trail-dualco...

Saxat lite ifrån hans text: "like many modern smartphone SoCs, the addition of extra cores simply increases the dynamic range of SoC power consumption." så vid lättare belastning antagligen ingen skillnad, men vid tyngre belastning så lär den dra mer än nuvarande single core.

Jo Intels lösning på program som kallar Native ARM libraries är ju ganska cool hade glömt den faktiskt
Men jag undrar hur mycket performance den kostar, inte sett några tester, hittade dock en notis om den återigen hos Anand (tråkigt men han är en av de få som faktiskt publicerar de mer tekniskt inriktade artiklarna).

Intel isn't disclosing much about the solution, but by intercepting ARM binaries and translating ARM code to x86 code on the fly during execution Intel is hoping to achieve ~90% app compatibility at launch. Binary translation is typically noticeably slower than running native code, although Intel is unsurprisingly optimistic about the experience on Android. I'm still very skeptical about the overall experience but we'll have to wait and see for ourselves.

http://www.anandtech.com/show/5365/intels-medfield-atom-z2460...

Edit
Roligt projekt med benchmark programmet du jobbar på! Hur långt har du kommit?
Har en hög olika ARM processorer, allt den som satt i gamla Legend upp till ARM A-15, kan hjälpa dig med ett comparison register om du drar ett PM när appen är klar

Senast redigerat 2013-02-25 23:29

Visa signatur

They say a little knowledge is a dangerous thing, but it's not one half so bad as a lot of ignorance
- Terry Pratchett
_____________________________

Rapportera Redigera

Citera flera Citera

2013-02-25 23:31

Permalänk

Flamso

Discokungen ★

Plats: Stockholm
Registrerad: Jun 2005

●

Skrivet av Justbecause:

Var iofs inte jag som undrade, utan svarade bara på enklast möjliga sätt då det inte är ett handarbete, men även dina filmklipp innefattar robotar

Skickades från m.sweclockers.com

Gå till inlägget

Det var inte meningen att vara otrevlig! Trodde du menade att de blev byggda av robotar, när robotarna mest lyfter runt wafers och dylikt!

Visa signatur

AMD 5800X3D - G.Skill Trident Z 3200 CL16 32GB - Asus B550 TUF - ASRock 7900 XTX Phantom - Intel 900p - CaseLabs S8 - LG 42C2 - Corsair AX1200i - Aquaero 6 - Vattenkyld

Rapportera Redigera

Citera flera Citera

2013-02-26 03:18

Permalänk

Justbecause

Avstängd

Registrerad: Sep 2012

●

Skrivet av Flamso:

Det var inte meningen att vara otrevlig! Trodde du menade att de blev byggda av robotar, när robotarna mest lyfter runt wafers och dylikt!

Gå till inlägget

Det finns många olika sorters robotar

Skickades från m.sweclockers.com

Visa signatur

MY ATTITUDE IS A RESULT OF YOUR ACTIONS! SO IF YOU DON'T LIKE MY ATTITUDE, BLAME YOURSELF!!

Rapportera Redigera

Citera flera Citera

2013-02-26 07:00

Permalänk

Anon192108

Avstängd

Registrerad: Apr 2012

●

Hade förväntat mig att Intel skulle gå på hårt med 14nm och snabbt ta marknadsandelar då TSMC kommer ner på 16nm i år. Blir magplask för Intel på mobila processorer tyvärr.

Skickades från m.sweclockers.com

Rapportera Redigera

Citera flera Citera

2013-02-26 07:12

Permalänk

Petterk

Medlem ★

Plats: Flen
Registrerad: Jul 2001

●

virtual void: Konverteringen sker ju inte i molnet alls utan det är en gammal myt, utan det sker med libhoudini och lite andra modifiering för att ackommodera detta. Det verkar vara en plattform som skött detta mycket bra, och vad det gäller binäröversättning så har Intel köpt upp mycket kompetens inom det området och har rätt mycket folk som kan allt kring kompilatorer/maskinkod för den delen. Android är helt rimligt att köra på flera arkitekturer som det är idag. Intels modem kommer fortsätta säljas med tredjepartschip däremot, precis som Infineons gjorde, denna verksamhet omsätter mycket mycket mer än när de drev Windows Mobile/Pocket PC, Linux och Blackberry-enheter med PXA/XScale. Intel är större på området än någonsin så det är klart att de lägger resurser på att få ut produkter, på att mjukvara fungerar osv. Det blir bara bättre där. Sen är det väl ganska naturligt att de inte hade något som konkurrera mot sin gamla PXA-linje när de sålde den verksamheten. SoCs på x86 fanns ju inte från Intel mellan 386EX (94) och Pentium M (anno 2007). Att de ville koncentrera på en ISA (flera design) har vi sett länge.

Rapportera Redigera

Citera flera Citera

2013-02-26 08:08

Permalänk

Tobbe Nukem

Medlem

Plats: Panama
Registrerad: Okt 2001

●

Skrivet av Skuggan74:

Hade förväntat mig att Intel skulle gå på hårt med 14nm och snabbt ta marknadsandelar då TSMC kommer ner på 16nm i år. Blir magplask för Intel på mobila processorer tyvärr.

Skickades från m.sweclockers.com

Gå till inlägget

Uhm. TSMC förväntas påbörja 16nm pilotproduktion i november 2013. Att dom får ut produkter baserade på 16nm för konsumenter i år är hyffsat långsökt.

Citat:

TSMC aims to have chip design kits for its 16-nm process available in January with the first foundation IP blocks such as standard cells and SRAM blocks ready a month later. It will start limited so-called “risk” production of the 16-nm process in November 2013. Production chip tape outs will follow about four or five quarters later.

Så i slutet av 2014 börjar vi se produkter baserade på TSMCs 16nm FinFET.

Visa signatur

That's just my opinion, I could be wrong...
> C2Q Q6700 > 8GB PC6400 > Gigabyte 965P-DQ6 > HD4870X2 & HD4650
> Lian Li PC-201B > Corsair HX620 > 10.46TB > HP LP3065 & 2x HP LP2065

Rapportera Redigera

Citera flera Citera (1)

2013-02-26 08:28

Permalänk

endnoy

Medlem

Plats: Stockholm
Registrerad: Apr 2012

●

Börjar likna en mobil-dator snart

Visa signatur

Jag har ingen TV, video, tv-box, radio, läsplatta eller dator. Jag har en gammal telefon som bara går att ringa och skicka SMS.

Rapportera Redigera

Citera flera Citera

2013-02-26 09:49

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Cove:

Man kan inte bara räkna cache design i latency, latencyn när det gäller cache står i direkt proportion till mängden minne. När Intel gick från prescott 1MB-2MB cache så ökade latencyn ifrån 21 till 27 cykler nått sånt. L1 cache som är väldigt liten ligger på en latency på 3-4 typiskt sett.
Och det är såklart mer parametrar en latency och minnes mängd som påverkar hur avancerad en cache är (bandbredd är en t.ex. )

Gå till inlägget

Jag har en känsla av att det inte gör det hela bättre för ARM. Att ha 40 cyklers latens är inte helt bra och långt efter Intel, att ha det på så små cachestorlekar är ännu värre. Sedan är ju bandbredd av mycket lägre betydelse än latens på cache.

Skrivet av Cove:

Har väldigt svårt och tro att Intel ligger 10 år före ARM (eller AMD) i cache design. Räknar du även in branch predicting till "cache features" så ligger de ju definitvt inte 10 år före.

Gå till inlägget

Vågar nog påstå att Pentium M har överlägsen branch prediction jämfört med ARM också, men det överlåter jag väl till Virtual Void att reda ut.

Rapportera Redigera

Citera flera Citera (1)

2013-02-26 12:45

Permalänk

Cove

Medlem ★

Plats: Malmö
Registrerad: Dec 2003

●

Skrivet av Aleshi:

Jag har en känsla av att det inte gör det hela bättre för ARM. Att ha 40 cyklers latens är inte helt bra och långt efter Intel, att ha det på så små cachestorlekar är ännu värre. Sedan är ju bandbredd av mycket lägre betydelse än latens på cache.

Vågar nog påstå att Pentium M har överlägsen branch prediction jämfört med ARM också, men det överlåter jag väl till Virtual Void att reda ut.

Gå till inlägget

Fast det där med 40 cyklers latens vet jag inte riktigt.. har för mig ARM 15 referens design har 25 cyklers latens.

Branch prediction enheten i nya ARM 15 processorn är rejält förbättrad sen A9, då bandbredden även är 128 bitar bred så tillåter arkitekturen numera att man flytta en 128 bitars neon instruktion i en enda klockcykel (då pentium M jobbade med 32 bitars register så är det minst 4 cykler ifall den inte får en miss)

utöver det så länkade jag redan till en heldel tester där den ARM-A15 verkar vara rejält snabbare än Atom.

Utöver det så lär nog qualcom få ytterligare ett bra år, då de har väldigt attraktiva helhetslösningar (inkl LTE) som blir svår att matcha för Intel. Jag Gissar på att Intel inte ett allvarligt hot förens vid nästa generation.

Visa signatur

They say a little knowledge is a dangerous thing, but it's not one half so bad as a lot of ignorance
- Terry Pratchett
_____________________________

Rapportera Redigera

Citera flera Citera

2013-02-26 12:52

Permalänk

danedi

Medlem

Plats: Piteå
Registrerad: Feb 2007

●

Skrivet av Gramner:

Få applikationer på mobiltelefoner använder multipla trådar i någon större omfattning så bra single-thread prestanda är det viktigaste.

Gå till inlägget

Det där citatet skulle ha varit sant i 2001 om man körde windows.
Läs på om pervasive multithreading som används i till exempel BeOS så ser du ganska klart att man kan överlåta threading till OS'et och BAM! så har du en threaded application. BeBook förklarar detta hur enkelt som hellst, både den och Scott Hackers bok finns att låna på ditt lokala bibliotek om än de måste beställas. Snacka inte dynga om du inte vet vad du pratar om. Windows och linux gör inte pervasive multithreading men linux har kernellocks och windows har inget alls i detta fall.. Windows kräver att du ska programmera med multithreading i åtanke, och till viss grad även i linux.

Palm webOS är till viss grad baserat på BeOS och har haft i stort sett samma ingenjörer. webOS är pervasive mt och det funkar lysande. Till och med macromedia flash på webOS är multithreaded vilket det inte är på windows PC's i samma grad.

Visa signatur

2x Xeon E5-2699 v4, 256gb Quad Channel RAM, 2x nVIDIA 980ti
----
AMD Ryzen 5950X, 128gb Dual Channel RAM, 2x AMD 6900XT
----
Massiv amiga och 3dfx-samling.

Rapportera Redigera

Citera flera Citera

2013-02-26 17:13

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Petterk:

virtual void: Konverteringen sker ju inte i molnet alls utan det är en gammal myt, utan det sker med libhoudini och lite andra modifiering för att ackommodera detta. Det verkar vara en plattform som skött detta mycket bra, och vad det gäller binäröversättning så har Intel köpt upp mycket kompetens inom det området och har rätt mycket folk som kan allt kring kompilatorer/maskinkod för den delen. Android är helt rimligt att köra på flera arkitekturer som det är idag. Intels modem kommer fortsätta säljas med tredjepartschip däremot, precis som Infineons gjorde, denna verksamhet omsätter mycket mycket mer än när de drev Windows Mobile/Pocket PC, Linux och Blackberry-enheter med PXA/XScale. Intel är större på området än någonsin så det är klart att de lägger resurser på att få ut produkter, på att mjukvara fungerar osv. Det blir bara bättre där. Sen är det väl ganska naturligt att de inte hade något som konkurrera mot sin gamla PXA-linje när de sålde den verksamheten. SoCs på x86 fanns ju inte från Intel mellan 386EX (94) och Pentium M (anno 2007). Att de ville koncentrera på en ISA (flera design) har vi sett länge.

Dold text

Gå till inlägget

Finns väldigt lite information kring exakt hur binärkonverteringen utförs, men den information som Intel lämnade innan Medfield släpptes var att konverteringen skulle vara automatisk (vilket den är) och att den inte skulle utföras på den mobila enheten då det skulle kosta för mycket ström. Med tanke på att det inte tar någon extra tid att installera saker som TuneIn, Angry Birds som alla innehåller ARM specifika NDK-delar så gissar jag att denna konvertering inte sker vid installationstillfället.

Det tar heller inte någon extra tid att starta programmet, inte ens första gången. Så drog helt enkelt slutsatsen att det Intel initialt sade att konvertingen kommer redan vara utförd innan man laddar ner APK filen stämmer. Och i så fall sker konverteringen i "molnet" sett från min punkt som användare.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera

2013-02-26 17:39

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Cove:

Man kan inte bara räkna cache design i latency, latencyn när det gäller cache står i direkt proportion till mängden minne. När Intel gick från prescott 1MB-2MB cache så ökade latencyn ifrån 21 till 27 cykler nått sånt. L1 cache som är väldigt liten ligger på en latency på 3-4 typiskt sett.
Och det är såklart mer parametrar en latency och minnes mängd som påverkar hur avancerad en cache är (bandbredd är en t.ex. )

Har väldigt svårt och tro att Intel ligger 10 år före ARM (eller AMD) i cache design. Räknar du även in branch predicting till "cache features" så ligger de ju definitvt inte 10 år före.

Hittar du någon studie som du kan länka till ? Enda rejäla försprånget det alltid pratas om är ju intels tillverkningstekniska försprång, hade de legat 10 år före i cache design (med tanke på hur viktig del det är i en modern processor) så hade det uppmärksammats mer.

Atom processorn må ha en ganska kort väg till cachen med låg latency men har o andra sidan 1MB (2x512), men ARM 15 kan ha upp till 4MB cache..

Atom har arkitekturen har inte direkt gett några generella prestandaökningar de senaste 5 åren, utan Intel har fokuserat att få ner effektförbrukningen, jämför man prestandan mellan A15 och Atom Dualcore, så ser A15 snabbare ut på det test som Anand Tech gjort.
Anandtechs jämförelse
Det är emot exynos dual core. enligt Anand så är Cortex A15 ca 40-65% snabbare i CPU testet (emot dualcore atom 1.6GHz)

Här är en annan artikel som jämför A15 emot Atom
http://www.extremetech.com/computing/139393-arm-cortex-a15-ex...

Anand verkar även skrivit lite om nya Atom släppet:
http://www.anandtech.com/show/6790/intels-clover-trail-dualco...

Saxat lite ifrån hans text: "like many modern smartphone SoCs, the addition of extra cores simply increases the dynamic range of SoC power consumption." så vid lättare belastning antagligen ingen skillnad, men vid tyngre belastning så lär den dra mer än nuvarande single core.

Jo Intels lösning på program som kallar Native ARM libraries är ju ganska cool hade glömt den faktiskt
Men jag undrar hur mycket performance den kostar, inte sett några tester, hittade dock en notis om den återigen hos Anand (tråkigt men han är en av de få som faktiskt publicerar de mer tekniskt inriktade artiklarna).

Intel isn't disclosing much about the solution, but by intercepting ARM binaries and translating ARM code to x86 code on the fly during execution Intel is hoping to achieve ~90% app compatibility at launch. Binary translation is typically noticeably slower than running native code, although Intel is unsurprisingly optimistic about the experience on Android. I'm still very skeptical about the overall experience but we'll have to wait and see for ourselves.

http://www.anandtech.com/show/5365/intels-medfield-atom-z2460...

Edit
Roligt projekt med benchmark programmet du jobbar på! Hur långt har du kommit?
Har en hög olika ARM processorer, allt den som satt i gamla Legend upp till ARM A-15, kan hjälpa dig med ett comparison register om du drar ett PM när appen är klar

Dold text

Gå till inlägget

Har precis börjat på benchmarken, men det borde inte ta allt för lång tid att få till den. Anledningen till att göra den var dels för att lära mig mer om Android-utveckling (detta är den största anledningen) men också då jag tycker att de flesta andra benchmarks endera visar väldigt lite av skillnader i CPU-delen (JavaScript benchmarks som beror väldigt mycket på kvalitén på JIT-kompilator, x86 verkar prestera bättre än förväntat i dessa benchmarks). Många andra benchmarks fokuserar alldeles för mycket på flyttal, något som kraftigt gynnar Cortex A15 som har en väldigt bra FPU men det säger väldigt lite om upplevd prestanda då nära nog allt vi kör är begränsat av heltalsprestanda alt. av GPU-prestanda.

Tittar man på dessa resultat och funderar på vilka som är heltalstunga så står ju sig Medfield (RAZR i) väldigt bra mot dual core Cortex A15 (Nexus 10) och då ska man inse att man jämför en pekplatta mot en telefon där pekplatta har betydligt mer "thermal headroom".

Dold text

Diskussionen kring hur många år före Intel ligger i cache-design är rätt meningslös, man kan i alla fall konstatera att Atom knappast är state-of-the-art på något sätt men den har ändå på många sätt en bättre cache-design än Cortex 15 och den är överlägsen Cortex A9.

L1 cache-latens
Atom: 3 cykler
Cortex A15: 4 cykler
Cortex A9: 4 cykler

L2 cache-latens (teoretiska minimum, verklig latens är högre och enligt t.ex. SiSoft Sandra testerna ligger Atom betydligt närmare sina teoretiska siffror)
Atom: 15 cykler
Cortex A15: 17 cykler
Cortex A9: 23 cykler

TLB miss-cost (TLB cachen är extremt viktig då den ligger före L1 cachen, väldigt ofta när man får en L2 miss får man även en TLB miss)
Atom: 7 cykler
Cortex A15: 12 cykler
Cortex A9: 7 cykler (ja, just detta är tydligt bättre på A9 jämfört med A15)

Edit: tänk på att latens adderas, så effektiv latens mot L2 är L1-latens + L2-latens + eventuell TBL-miss latens.
Och vad det gäller storleken kontra latens: visst ökar latens med större storlek men Intels L3 cache på SNB har en total latens (d.v.s inklusive latens från L1 och L2) på 26-31cykler vid 8MB och bara några cykler till vid 20MB!

Hittar väldigt lite om hur branch-prediction fungerar på A15, Atom har en lite obalanserad design här branch taken/not-taken tabellen är så pass mycket större än branch-target tabellen så med "objektorienterad" kod där man har ganska mycket indirekta hopp (hopp via funktionspekare) så kan Atom mycket oftare avgöra om de ska hoppa eller ej, men den vet inte vart (branch.target). En full miss kostar 15 cykler på Atom och lär kosta minst lika mycket på Cortex A15 då den har en pipeline på 15-21 steg (beror på vilken instruktion man kör) vilket är väldigt långt för att vara ARM, Cortex A9 hade bara 9 steg. Så A15 behöver en väldigt bra branchpredictor, 15 steg är längre än den effektiva längden på Sandy Bridge (som är 14 steg)!

Tittar man på designen av CPU-kärnan på Cortex A9, A15 och jämför med Atom så inser man snabbt att något i Atom måste vara väldigt mycket bättre jämfört med ARM får Atom är en dual-issue in-order design där endast den ena pipelin:en kan utföra instruktioner som går mot minnet (och 32-bitars x86 har väldigt ont om register). Jämför detta mot A9 helt symmetriska dual-issue out-of-order design och Cortex A15 trippel-issue + quad execute out-order design. Givet denna information så ligger A15 närmare en Pentium M i design men en Pentium M har dubbel IPC jämfört med Atom, något knappast A15 har. Även A9 borde på pappret demolera Atom, men Atom är tvärtom snabbare. Ska bli väldigt intressant att se den nya Atom-plattformen på 22nm med FinFET och out-of-order execution. Designen av CPU-cachen blir ju än mer komplex när man går OoO då CPUn kan ha väldigt många läsningar och skrivningar "in flight", något som inte är möjligt med in-order då allt sker, well, i ordning

Cortex A15 drar också betydligt mer ström än Medfield och Clover Trail. Enligt det test som AnandTech gjorde så har Atom bättre prestanda/W än både A9 och A15, A9 har i sin tur bättre prestanda/W än A15.

Senast redigerat 2013-02-26 17:58

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (2)

2013-02-26 18:55

Permalänk

Cove

Medlem ★

Plats: Malmö
Registrerad: Dec 2003

●

Skrivet av Yoshman:

Har precis börjat på benchmarken, men det borde inte ta allt för lång tid att få till den. Anledningen till att göra den var dels för att lära mig mer om Android-utveckling (detta är den största anledningen) men också då jag tycker att de flesta andra benchmarks endera visar väldigt lite av skillnader i CPU-delen (JavaScript benchmarks som beror väldigt mycket på kvalitén på JIT-kompilator, x86 verkar prestera bättre än förväntat i dessa benchmarks). Många andra benchmarks fokuserar alldeles för mycket på flyttal, något som kraftigt gynnar Cortex A15 som har en väldigt bra FPU men det säger väldigt lite om upplevd prestanda då nära nog allt vi kör är begränsat av heltalsprestanda alt. av GPU-prestanda.

Tittar man på dessa resultat och funderar på vilka som är heltalstunga så står ju sig Medfield (RAZR i) väldigt bra mot dual core Cortex A15 (Nexus 10) och då ska man inse att man jämför en pekplatta mot en telefon där pekplatta har betydligt mer "thermal headroom".
http://images.anandtech.com/graphs/graph6440/51547.png

http://images.anandtech.com/graphs/graph6440/51548.png

http://images.anandtech.com/graphs/graph6440/51549.png

http://images.anandtech.com/graphs/graph6440/51553.png