AMD till rätten för falsk marknadsföring av arkitekturen Bulldozers kärnor

Permalänk
Medlem
Skrivet av CubaCola:

Fast jag som själv har ägt en 386 då det begav sig vet att den jämförelsen inte är så bra, då man kunde köpa till en FPU och sätta i den tomma sockeln på moderkortet.
Något som är ganska svårt (omöjligt) på en dator med FX8150 cpu.

edit: kollade precis specifikationerna på AMD:s sida, och hittar ingen information om att FPU delas av 2 kärnor.
Står bara 8 cores 8 threads där, så även om kunden läste på så fanns inte informationen på den officiella sidan hos tillverkaren, och då är det inte så bra att skylla på att kunden inte läst specifikationerna.

https://www.amd.com/en/products/cpu/fx-8150

Min första dator hade en Am386 och redan då hade jag tillräckligt intresse för att skruva isär burkar för att se vad som satt i dem, så jag är inte helt obekant med hur datorerna såg ut på den tiden. Att det inte går att trycka in en socklad Intel 80287 på ett moderkort kompatibelt med FX-8150 ser jag inte som relevant för frågan, det handlar ju om huruvida man ska se flyttalsenheterna som en del av CPU-paketet eller kärnorna. Nytt för 80386 var ju att FPUn, som om jag minns rätt mer eller mindre var en 80287 på samma kisel och därmed var kompatibel med kod för 80286+80287, kom inbyggt i paketet istället som en separat processor. På nästan samma sätt är det 4 flyttalsenheter på samma kisel som 8 kärnor i en FX-8xxx.

AMDs sida är inte vad den var 2010, de har inte ens kvar pressmeddelanden från 2010 på sidan. Här är dock en av pressbilderna som publicerades i samband med lanseringen:

Personligen ser jag inga otydligheter i att det skulle vara en flyttalsenhet per två kärnor i bilden. Ska se om jag kan hitta några relevanta arkiverade versioner av sidorna på archive.org.

Edit: Hittade denna sida via archive.org: https://web.archive.org/web/20101025231047/http://blogs.amd.c...

Här är den första frågan i AMDs Q&A för Bulldozer just denna fråga; vad är egentligen en "kärna" i Bulldozer? De förklarar att varje modul innehåller 2 kärnor och delar viss logik för att hålla nere effektförbrukning och kiselstorlek. Hela frågan och svaret från sidan citerat nedan:

Citat:

” There has been some confusion among those in the tech community regarding the actual CPU architecture, with ‘modules’ and ‘cores’ being explained differently by different people. “ – Waffle911

Yes, there has definitely been some confusion about modules and cores. Modules are only our way of laying out the subcomponents of the processor. You will not see us market modules as they are largely invisible to everyone but the designers. Operating systems, for instance, will enumerate the integer cores, seeing a 16-core AMD Operton™ processor (currently codenamed “Interlagos”) as 16 cores, not 8 modules. Modules do impact the way that certain CPU features are addressed – a discussion of which we’ll save for a later date – but in general we will focus on cores and not modules. The reason that we have modules is to help cut down on a lot of redundant circuitry in the processor. With multiple cores there is lots of duplication and this eats up die space and increases power draw. There are areas within the processor that can be shared because there is no major impact on performance, and other areas that should not be shared because they create bottlenecks.

You will never see a spec sheet with modules called out. Modules will not have a “marketing name”, they will only be “”Bulldozer” modules.” In reality, modules will only matter to the designers. Since we went out with ”Bulldozer” information very early we focused on the shared architecture and talked at the module level (it is still far too early to be sharing die shots….) Because of this the two most misunderstood theories became a.) the module was the whole processor and b.) the module was somehow equal to one core.

When we talk about cores we will always be using the most agreed upon definition of cores – the integer logic. Today most workloads are integer with a much smaller portion being floating point. This is why we focused on integer cores as the most logical way to define a core.

Each integer core will be able to run one software thread, and these threads can all be done simultaneously, unlike an SMT-type technology that lets two threads share one core. You typically find SMT technology on processors with much lower core counts, and its shared nature can create bottlenecks, even resulting in negative throughput in some cases.

As for core counts, here is what we have committed to at this point:

  • “Interlagos” – 16-core server processor

  • “Valencia” – 8-core server processor

  • “Zambezi” – 8-core client processor

1:Fel årtal 2:Missade slutet av svaret
Visa signatur

Mjölnir: Ryzen 9 3900X | X570-I | Ballistix Sport 32GB | Powercolor RX 5500XT 4GB ITX | Kolink Sattelite
Server: Ryzen 5 1400 | X470-F | Ballistix Sport 24GB | ASUS HD 7790 2GB | Sapphire RX 470 8GB ME | NZXT Switch 810

Permalänk
Skrivet av Xinpei:

Visst är det beklagligt att rebrands ens existerar MEN AMD sitter inte i någon ekonomiskt sits att utveckla helt nya kort för varenda generation. Vilket inte ens Nvidia gör (trots att deras budget är många gånger högre än AMDs). Däremot hur det skulle vara AMDs fel att en butiksanställd sålt en dator till någon som uppenbarligen inte är påläst förstår jag inte alls. Det är liksom inte deras ansvar att folk läser på eller hur? Sedan är inte R9 2xx serien någon generation nyare.. den är EN generation nyare. R9 2xx-serien efterföljde HD7xxx serien på desktop efter HD8xxx serien var mest för laptops och OEM datorer (kan jämföras med Nvidias 800-serie kort).

Det handlar inte om att jag inte förstår utan det handlar om att jag inte alls håller med dig om företags krav på att se till att det inte går att missförstå saker och ting. För det är i praktiken helt omöjligt.

Alltså, du fattar inte alls vad jag menar. Problemet är inte rebeandingen i sig utan att man tagit en budgetmodell och rebrandat den till en nyare generation i top klassen R9.

Permalänk
Medlem

@Djhg2000: Dels så hade inte någon modell utav 386 någon FPU, utan den kom socklad på moderkortet bredvid.

Det jag menade var att på en 386 så visste man att man inte fick någon FPU, utan fick därför köpa till en FPU (som heter 80387) och sätta i sockeln som fanns för detta ändamål på moderkortet.
Inte att man kan köpa en FPU till en gammal intel processor att sätta dit i efterhand på en FX8150, det vore givetvis lite småroligt om så var fallet.

Däremot så tycker jag inte att jämförelsen är sådär jättebra, då man som sagt visste att 386 inte hade någon FPU, men om man missade detta så gick det att fixa i efterhand genom att sätta dit FPU:n på moderkortet.

Däremot med fallet FX8150 så får man vad man köpt.

Att försöka stämma AMD för detta är dock lite löjeväckande, då det borde på sin höjd räcka med pengarna tillbaka (inom skälig tid) men att 4 år senare försöka få igen pengarna för en processor som kostade typ 2500kr ny, är bara slöseri med advokater och domstolar.

Lite som att köpa ett par för små skor, och 5 år senare stämma Puma för att deras storlek 41 inte är samma som Adidas storlek 41, istället bara för att gå tillbaka till butiken och lämna tillbaka skorna och få pengarna tillbaka.

Visa signatur

I5 9600k@stock / Cooler Master Evo 212 / Gigabyte Z390 Gaming X / Corsair Vengeance LPX 16GB DDR4 3000MHz / MSI RTX2070 Gaming Z / EVGA 550 BQ / Asus VG27BQ 27" 165Hz

Ryzen 5 5600x@stock / Asus Rog Strix X570-E Gaming / Corsair Vengeance RGB Pro 16GB 3600MHz CL18 / MSI RTX3070 Suprim X / BeQuiet Pure Power 11 600W / Asus VG278Q 27" 144Hz

Permalänk
Medlem
Skrivet av galenmyra:

Alltså, du fattar inte alls vad jag menar. Problemet är inte rebeandingen i sig utan att man tagit en budgetmodell och rebrandat den till en nyare generation i top klassen R9.

Så du är inte emot rebranding men du är emot en typ av rebranding? Det är snarare du som inte vill förstå VAD JAG VILL komma fram till. Alltså att problemen inte ligger hos AMD utan ligger hos försäljare och köpare. Det är köparen som fått för sig att R9 betyder toppsegment och inte bara är en siffra.

Toppsegmentet från 200-serien var R9 280, 280X, 290 och 290X. Allt under kan inte påstås ligga i toppsegmentet. R9 kan alltså jämföras med Nvidias GTX prefix. Där fanns alltså allt från GTX 1050 till GTX 1080 Ti. R9 255 är ett kort som kan jämföras med Nvidias gamla GTX 750Ti. Poängen är alltså att bara för att ett kort har prefixen R9/GTX så betyder det inte att det är ett kort i toppsegmentet.

Försök hålla känsloargumentet utanför detta.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av CubaCola:

@Djhg2000: Dels så hade inte någon modell utav 386 någon FPU, utan den kom socklad på moderkortet bredvid.

Det jag menade var att på en 386 så visste man att man inte fick någon FPU, utan fick därför köpa till en FPU (som heter 80387) och sätta i sockeln som fanns för detta ändamål på moderkortet.
Inte att man kan köpa en FPU till en gammal intel processor att sätta dit i efterhand på en FX8150, det vore givetvis lite småroligt om så var fallet.

Däremot så tycker jag inte att jämförelsen är sådär jättebra, då man som sagt visste att 386 inte hade någon FPU, men om man missade detta så gick det att fixa i efterhand genom att sätta dit FPU:n på moderkortet.

Däremot med fallet FX8150 så får man vad man köpt.

Att försöka stämma AMD för detta är dock lite löjeväckande, då det borde på sin höjd räcka med pengarna tillbaka (inom skälig tid) men att 4 år senare försöka få igen pengarna för en processor som kostade typ 2500kr ny, är bara slöseri med advokater och domstolar.

Lite som att köpa ett par för små skor, och 5 år senare stämma Puma för att deras storlek 41 inte är samma som Adidas storlek 41, istället bara för att gå tillbaka till butiken och lämna tillbaka skorna och få pengarna tillbaka.

Det stämmer, jag har slarvigt blandat ihop 386 med 486. Den stora nyheten i funktionalitet för 386 var ju MMU, inte FPU. Pinsamt misstag. Låter 386 stå kvar i mina tidigare inlägg för att inte mangla innebörden i dina inlägg.

Då är jag lite mer hemma på din poäng, det ligger ju något i att ingen 80x86-processor innan hade inbyggd flyttalsenhet och att det därför var onaturligt att anta att den plötsligt skulle ha det.

Samtidigt står jag fast vid att med all publicitet det ovanliga upplägget med Bulldozer fick redan innan lansering, kombinerat med alla förklaringar i form av text och illustrativa bilder AMD gav till pressen, ser jag inte hur man kan kalla det för missvisande marknadsföring. Om du var i läget att spendera pengar på en Bulldozer hade det tagit dig sekunder att hitta information om delade flyttalsenheter via Google.

Kort sagt; om man var tillräckligt insatt för att bry sig om problemet borde man ha fått reda på det flera gånger via tekniknyheter långt innan man spenderade pengar på moderkort och CPU. Det får mig att undra om de som nu stämmer AMD är samma personer som bara köper det dyraste och senaste utan att bry sig om vad de egentligen köper, varpå de gnäller över att de har köpt "grisen i säcken" när det egentligen var de som kastade säcken över grisen.

Skickades från m.sweclockers.com

Visa signatur

Mjölnir: Ryzen 9 3900X | X570-I | Ballistix Sport 32GB | Powercolor RX 5500XT 4GB ITX | Kolink Sattelite
Server: Ryzen 5 1400 | X470-F | Ballistix Sport 24GB | ASUS HD 7790 2GB | Sapphire RX 470 8GB ME | NZXT Switch 810

Permalänk
Skrivet av Xinpei:

Så du är inte emot rebranding men du är emot en typ av rebranding? Det är snarare du som inte vill förstå VAD JAG VILL komma fram till. Alltså att problemen inte ligger hos AMD utan ligger hos försäljare och köpare. Det är köparen som fått för sig att R9 betyder toppsegment och inte bara är en siffra.

Toppsegmentet från 200-serien var R9 280, 280X, 290 och 290X. Allt under kan inte påstås ligga i toppsegmentet. R9 kan alltså jämföras med Nvidias GTX prefix. Där fanns alltså allt från GTX 1050 till GTX 1080 Ti. R9 255 är ett kort som kan jämföras med Nvidias gamla GTX 750Ti. Poängen är alltså att bara för att ett kort har prefixen R9/GTX så betyder det inte att det är ett kort i toppsegmentet.

Försök hålla känsloargumentet utanför detta.

Känsloargumentet? Vet inte vad du pratar om. Nej det är inte köpar som "får för sig" att R9 betyder topsegment, det är AMD som valt att kalla sina kort i topsegmentet för R9, att då rebranda ett gammalt budgetkort till samma namn är vilseledande, det borde hetat R7 elelr R5. Ett R9 255 motsvars inte av ett GTX 750 Ti. Tom ett 7770 får stryk av ett GTX 460, och ett 7750 ligger en bit under det.

EDIT: Så här beskriver AMD vad R9 serien är:
Leading-edge performance ​and innovative technologies for extreme 4K and VR gaming. For Gamers that demand the best.
Källa: https://www.amd.com/en-us/products/graphics/desktop/r9

Permalänk
Datavetare
Skrivet av DasIch:

Det kommer inte endast handla om de tekniska aspekterna i domstolen. Även om detta såklart talar till AMD's nackdel finns det andra frågor, som exempelvis konsumentens egna ansvar och vilken skada de faktiskt lidit.

Om det nu slås fast att det varit vilseledande att kalla 4 kärnor för 8, då blir följdfrågan: So what? Vad sägs om att AMD kontrar med: "Visst, det blev lite tokigt i vår marknadsföring. Däremot har vi levererat den prestanda vi utlovat, vilket även bekräftas av oberoende tester. Ingen konsument har blivit lidande av detta".

Observera att jag inte uttalar mig om vad som är rätt eller fel i frågan, utan det jag vill belysa är att det finns många olika sätt att argumentera fram och tillbaka i frågan.

Som jag förstår detta fall så är det just frågan kring om fallen ens kvalificerar sig för att vara ett potentiellt problem. Verkar vara det man spendera ett par år på. T.ex. har man slagit fast att det är möjligt att beräkna värdet på "skadan".

Är först nu man ska utreda de tekniska bitar kring om marknadsföringen kan anses ha varit missledande.

Skrivet av Djhg2000:

Här är utskriften från "lscpu -e" på min laptop med i7-3840QM (Ivy Bridge):

$ lscpu -e CPU NODE SOCKET CORE L1d:L1i:L2:L3 ONLINE MAXMHZ MINMHZ 0 0 0 0 0:0:0:0 yes 3800.0000 1200.0000 1 0 0 0 0:0:0:0 yes 3800.0000 1200.0000 2 0 0 1 1:1:1:0 yes 3800.0000 1200.0000 3 0 0 1 1:1:1:0 yes 3800.0000 1200.0000 4 0 0 2 2:2:2:0 yes 3800.0000 1200.0000 5 0 0 2 2:2:2:0 yes 3800.0000 1200.0000 6 0 0 3 3:3:3:0 yes 3800.0000 1200.0000 7 0 0 3 3:3:3:0 yes 3800.0000 1200.0000

Tycker definitivt att HT-tråderna ser ut att dyka upp parvis här, vilket också stämmer med vad jag kommer ihåg från min i7-2600.

CPUID vad jag vet dumpar bara en intern blob och har ingen aning vad informationen den dumpar faktiskt betyder, men ser inte hur varken implementationen eller prestandan av CPUID har någon betydelse här?

Lite av ett sidospår, men behövde faktiskt kolla upp hur det ligger till med soft float numera, och i alla fall GCC har mycket riktigt inte ett inbyggt bibliotek för det längre. Poängen var dock att NT-kerneln antar att x87-instruktionerna finns implementerade på traditionellt sätt (som i Intel 80386-kompatibel) och det du säger här stödjer ju mitt påstående.

Givet vad CPUID returnerade på Bulldozer ser jag det mer som en bugg i schemaläggaren. Antar att AMD testade sig fram till vad de skulle mata in i CPUID för att får bästa prestandan vid lanseringen och löste problemen i efterhand tillsammans med Microsoft. Resultatet är röran vi har idag. Linux kunde de ju fixa på egen hand i förtid utan att någon reagerade eftersom det är öppen källkod och om patchen är tillräckligt väl skriven ser det ut som vilken liten buggfix som helst.

Zen har en väldigt intressant implementation av SMT som skiljer sig markant från hur Core gör och ger bara liknande resultat i genomsnitt. Lite mer information om skillnaderna i denna video:
https://www.youtube.com/watch?v=3K02zTu_baY

Givet att Bulldozer har separata heltalsenheter för varje kärna ser jag inte hur den skulle bete sig nära Core när du inte räknar flyttal, och siffrorna i artikeln du länkade visar i stort sätt bara att den delade flyttalsenheten är en begränsande faktor när du räknar just flyttal. picCOLOR (och bilbehandlingsalgoritmer i allmänhet) är ju tämligen flyttalstunga och räknar dessutom väldigt ofta med transformationsmatriser för att utnyttja SIMD så gott det går. Ska du ha en rättvis jämförelse ska du också ha med heltalstunga program.

Den definitionen är dock lite missvisande om man inte tydliggör att ganska många instruktioner i x86 inte exekverar på en klockcykel. Anledningen till att du kan dela "fetch" och "decode" och ändå få god prestanda är ju att du kan hålla din pipeline fylld medan efterföljande steg fortsätter exekvera instruktioner. Nu spelar jag ju lite djävulens advokat här, men jag hoppas att du ser förbi den löjliga nivån och förstår poängen ändå.

Svårt ja, omöjligt nej. På något sätt klarade vi oss genom att hantera flyttal på separat processor tidigare. Vi skulle utan tvekan behöva någon workaround för existerande kod (troligen emulering) och kompilatorer skulle sannolikt behöva processorspecifika implementationer för flyttal.

Men det är ju bara ytterligare ett argument för AMD att implementera det som SMT istället för att separera ut flyttal, så åter igen stärker du bara mitt argument om att AMD kanske fixade mjukvara med hårdvara.

Om vi bortser från flyttalens existens helt och hållet skulle jag inte kalla Bulldozer FX-8xxx för något annat än 8 kärnor med parvis optimerad pipeline och cache. 8 instruktioner av godtycklig typ kan då exekveras samtidigt (med en offset i latens per par eftersom de inte kan starta exakt samtidigt). Som en konsekvens av den delade cachen kan dock samma data behandlas av två trådar samtidigt och leder därför till en extra väg att optimera prestanda.

Jag tycker tvärt om att AMD inte har gjort något direkt fel här. Om kunderna förväntade sig lika många beräkningsenheter för flyttal som för heltal har de dels inte läst specifikationerna tillräckligt noga och dels känner inte till historien om x86 innan Intel 80386 där flyttal inte ens var en del av CPUn.

Är det en ovanlig konfiguration av beräkningsenheter? Ja.
Är det en missledande konfiguration av beräkningsenheter? Inte enligt mig.

Hur trådarna dyker upp är ju totalt irrelevant för det som diskuteras här då det inte något praktisk implikation utöver att man måste ha koll på ordningen om man vill köra saker specifikt på två CPU-trådar i samma kärna eller på separata kärnor. Jag har samma ordning på Sandy Bridge som den personen som postade detta, även Nehalem (i7-960 i detta fall) verkar ha samma ordning för denna person.

Påpekandet kring CPUID var enbart att belysa att instruktionen kan patchas och i detta fall skulle en sådan patch inte ens orsaka några potentiella prestandaproblem då CPUID inte används i prestandakritiska lägen.

Vad det gäller OS-kärnor så finns bara en enda sak de i praktiken bryr sig om när det kommer till flyttal: har minst en instruktion körts som använder flyttal sedan senaste kontext-switch? Om ja behövs lite extra hantering av sparande/återställning av flyttalsregister vid nästa kontext-swich. Men bl.a. Linux skippar numera att ens försöka reda ut detta, finns en overhead och är både enklare samt i praktiken lika snabbt att alltid spara/återställa alla register, inklusive de för flyttal. En stor orsak är att x86_64 använder ju SSE-register för flyttal, men SSE register används ju även för heltal (bl.a. för minneskopiering) så i praktiken används nästan alltid dessa register oavsett om programmet jobbar med flyttal eller ej.

Om datorn har en i387, om två (eller åtta som i fallet SPARC T1) CPU-kärnor delar FPU är totalt irrelevant för OS:et. Det är bara en implementationsdetalj, enda OS:et bryr sig om är att alla CPU-trådar har ett separat arkitekturtillstånd för både heltal och flyttal (d.v.s. en egen uppsättning av alla ISA synliga register). Så för detta fall är FPU-delens implementation i Bulldozer irrelevant för det som fallet handlar om.

Vad fallet handlar om är huruvida det kan tänkas vara felaktigt att kalla logiska processorer för "kärnor" i marknadsmaterial. För är vi är väl ändå överens om att

  • Bulldozer presterar sig som en 4C/8T

  • Optimala sättet att schemalägga både heltalsuppgifter (se @FattarNiInte post om 7z) och flyttal (som TechReport primärt testade) är att schemalägga saker exakt som man gör på Core/Zen med SMT. Ja, det är en mindre skillnad mellan att lägga jobb på två separata kärnor jämfört med att lägga det på två CPU-trådar i samma kärna (framförallt för heltalslaster) för Bulldozer, men det är samma optimala val ett OS ska göra (vilket visar att definitionen som används för SMT har en verkligen positivt poäng)

Vad det gäller videon du postade passar jag och kommentera den mer än att säga: WTF håller han på med där?

Skrivet av Djhg2000:

Det stämmer, jag har slarvigt blandat ihop 386 med 486. Den stora nyheten i funktionalitet för 386 var ju MMU, inte FPU. Pinsamt misstag. Låter 386 stå kvar i mina tidigare inlägg för att inte mangla innebörden i dina inlägg.

Blev nog fortfarande inte helt rätt. MMU introducerades faktiskt med 286, nyheten i 386 var 32-bitars register (EAX, EBX etc).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Hur trådarna dyker upp är ju totalt irrelevant för det som diskuteras här då det inte något praktisk implikation utöver att man måste ha koll på ordningen om man vill köra saker specifikt på två CPU-trådar i samma kärna eller på separata kärnor. Jag har samma ordning på Sandy Bridge som den personen som postade detta, även Nehalem (i7-960 i detta fall) verkar ha samma ordning för denna person.

Nu får du inte glömma bort att inlägget jag ursprungligen svarade på var detta:

Skrivet av FattarNiInte:

Om man i linux sätter cpu affinity till 1,3,5 och 7 för en 8 kärnig bulldozer presterar den som väntat, vilket också görs automatiskt.
Sätter man 1,2,3,4 är den dålig men endå snabbare än endast 1 och 3.

På fyrkärnig intel sätter man 1,2,3 och 4. 5,6,7 och 8 är ht.
Av kompatibilitetsskäl hade det varit vettigare att se den som 4 kärnig med ht. Jag gissar att windows gör så.

Skickades från m.sweclockers.com

Invändningen var att man inte kan anta i vilken ordning trådarna kommer, och därför heller inte borde göra påståenden om det (med undantag för diskussion av exakta modeller).

Skrivet av Yoshman:

Påpekandet kring CPUID var enbart att belysa att instruktionen kan patchas och i detta fall skulle en sådan patch inte ens orsaka några potentiella prestandaproblem då CPUID inte används i prestandakritiska lägen.

Fast då har du missat min poäng. Anledningen till att patcha CPUID skulle i det hypotetiska fallet vara att NT-kerneln har lärt sig en alternativ tolkning av CPUID. Till exempel hade AMD kunnat presentera kärnorna som asymmetriska, där ena hälften kan räkna flyttal och andra hälften bara kunde det när den första kärnan i paret inte gör det, något som NT-kerneln inte kunde hantera (och kanske fortfarande inte kan hantera).

Skrivet av Yoshman:

Vad det gäller OS-kärnor så finns bara en enda sak de i praktiken bryr sig om när det kommer till flyttal: har minst en instruktion körts som använder flyttal sedan senaste kontext-switch? Om ja behövs lite extra hantering av sparande/återställning av flyttalsregister vid nästa kontext-swich. Men bl.a. Linux skippar numera att ens försöka reda ut detta, finns en overhead och är både enklare samt i praktiken lika snabbt att alltid spara/återställa alla register, inklusive de för flyttal. En stor orsak är att x86_64 använder ju SSE-register för flyttal, men SSE register används ju även för heltal (bl.a. för minneskopiering) så i praktiken används nästan alltid dessa register oavsett om programmet jobbar med flyttal eller ej.

Om datorn har en i387, om två (eller åtta som i fallet SPARC T1) CPU-kärnor delar FPU är totalt irrelevant för OS:et. Det är bara en implementationsdetalj, enda OS:et bryr sig om är att alla CPU-trådar har ett separat arkitekturtillstånd för både heltal och flyttal (d.v.s. en egen uppsättning av alla ISA synliga register). Så för detta fall är FPU-delens implementation i Bulldozer irrelevant för det som fallet handlar om.

Fast implementationen är ju relevant, i alla fall på en konceptuell nivå; är flyttalsenheterna delar av kärnorna eller inte? Här skulle jag argumentera nej, eftersom de bara är delade resurser på kislet. En Bulldozer-kärna kan alltså bara räkna med heltal. Att de bara kommer tillsammans med parvis delade flyttalsenheter må vara irrelevant för OS-kärnan (terminologivarning!) men det är högst relevant för definitionen av vad en kärna är.

Skrivet av Yoshman:

Vad fallet handlar om är huruvida det kan tänkas vara felaktigt att kalla logiska processorer för "kärnor" i marknadsmaterial. För är vi är väl ändå överens om att

  • Bulldozer presterar sig som en 4C/8T

  • Optimala sättet att schemalägga både heltalsuppgifter (se @FattarNiInte post om 7z) och flyttal (som TechReport primärt testade) är att schemalägga saker exakt som man gör på Core/Zen med SMT. Ja, det är en mindre skillnad mellan att lägga jobb på två separata kärnor jämfört med att lägga det på två CPU-trådar i samma kärna (framförallt för heltalslaster) för Bulldozer, men det är samma optimala val ett OS ska göra (vilket visar att definitionen som används för SMT har en verkligen positivt poäng)

Jag antar att den första punkten är felstavad och att du egentligen menar "presenterar"? I så fall håller jag med.

Den andra punkten håller jag bara delvis med om. Kärnorna i en Bulldozer kan arbeta helt oberoende efter "decode"-steget förutsatt att de inte räknar med flyttal, vilket vad jag kan se bekräftas av båda testerna. Naturligtvis ska schemaläggaren också vara medveten om att kärnorna saknar egna flyttalsdelar. Med koden som existerade vid lanseringen betydde det att processorn behövde lura schemaläggaren till att behandla dem som trådar i SMT för att inte lägga flyttalsjobb på alla kärnor samtidigt.

Att äkta SMT skalar på liknande sätt är bara kuriosa i sammanhanget.

Skrivet av Yoshman:

Vad det gäller videon du postade passar jag och kommentera den mer än att säga: WTF håller han på med där?

Ett tappert försök att jämföra IPC mellan Zen och Skylake, som faller platt på många punkter där de halt enkelt inte går att jämföra. Han har dock lyckats gräva upp en del intressanta detaljer om hur de interna mekanismerna fungerar i respektive arkitektur, bland annat implementationerna av SMT.

Skrivet av Yoshman:

Blev nog fortfarande inte helt rätt. MMU introducerades faktiskt med 286, nyheten i 386 var 32-bitars register (EAX, EBX etc).

Tekniskt sett ja, men MMUn i 80286 är inte alls lika avancerad och ganska värdelös för moderna OS. MMUn i 80386 (och Am386) var den första för x86 som klarade att hantera minnessidor, utöver rena segment som den tidigare. Skillnaden blir (som du antagligen vet men jag vill förtydliga för övriga läsare i tråden) att hela virtuella minnet per program inte behöver vara kontinuerligt allokerat för att kunna gå genom MMUn.

Men ska man vara noga kom ju såklart den grundläggande funktionaliteten MMU till x86 med 80286. Jag kanske skulle ha sagt "modern MMU" istället. Roligt nog var den första formuleringen "Den stora nyheten (utöver 32-bit) för 386 var ju MMU, inte FPU.", men jag ändrade det till "Den stora nyheten i funktionalitet för 386 var ju MMU, inte FPU." av någon anledning. Kanske inte den bästa ändringen jag har gjort precis innan postning.

Visa signatur

Mjölnir: Ryzen 9 3900X | X570-I | Ballistix Sport 32GB | Powercolor RX 5500XT 4GB ITX | Kolink Sattelite
Server: Ryzen 5 1400 | X470-F | Ballistix Sport 24GB | ASUS HD 7790 2GB | Sapphire RX 470 8GB ME | NZXT Switch 810

Permalänk
Medlem
Skrivet av galenmyra:

Känsloargumentet? Vet inte vad du pratar om. Nej det är inte köpar som "får för sig" att R9 betyder topsegment, det är AMD som valt att kalla sina kort i topsegmentet för R9, att då rebranda ett gammalt budgetkort till samma namn är vilseledande, det borde hetat R7 elelr R5. Ett R9 255 motsvars inte av ett GTX 750 Ti. Tom ett 7770 får stryk av ett GTX 460, och ett 7750 ligger en bit under det.

EDIT: Så här beskriver AMD vad R9 serien är:
Leading-edge performance ​and innovative technologies for extreme 4K and VR gaming. For Gamers that demand the best.
Källa: https://www.amd.com/en-us/products/graphics/desktop/r9

Nej. AMD beskriver vissa kort i segmentet. Men du verkar ha intalat dig att AMD på något sätt gjort fel för att folk inte läser på så det är ingen idé att försöka argumentera längre.

Ha en bra kväll.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

Helt galet att vanliga människor Identifierar sig så hårt med ett stort multinationellt företag så att dom förnekar varenda uns av felaktigheter som företaget gör. Men sedan i nästa vändning kastar dom sig som rovdjur över dess konkurrenter då dessa gör något snedsprång. Ja vi vet AMD är bara Good Guys som bara tänker på konsumentens bästa och vi köper AMD grejer för dom är Good Guys, inte för att dom har dom bästa grejerna.

Permalänk
Medlem

Suck. Vem fan bryr sig.

Visa signatur

[IT-Dept]
Ryzen 1700 OC - 32 - 1070

Permalänk
Skrivet av Xinpei:

Nej. AMD beskriver vissa kort i segmentet. Men du verkar ha intalat dig att AMD på något sätt gjort fel för att folk inte läser på så det är ingen idé att försöka argumentera längre.

Ha en bra kväll.

Nej AMD skriver inget om att deras beskrivning bara gäller vissa kort i segmentet.

"du verkar ha intalat dig att AMD på något sätt gjort fel" ja, uppenbarligen kände konsumenten sig lurad av AMDs val av namn till sitt kort i detta fallet, vilken jag anser var vilseledande av AMD med tanke på hur dom beskriver sin R9 serie, ser inget konstigt med att jag har en åsikt...

Permalänk
Medlem
Skrivet av MarkSix:

Helt galet att vanliga människor Identifierar sig så hårt med ett stort multinationellt företag så att dom förnekar varenda uns av felaktigheter som företaget gör. Men sedan i nästa vändning kastar dom sig som rovdjur över dess konkurrenter då dessa gör något snedsprång. Ja vi vet AMD är bara Good Guys som bara tänker på konsumentens bästa och vi köper AMD grejer för dom är Good Guys, inte för att dom har dom bästa grejerna.

Eller... så är denna stämning ett skämt och folk stipulerar bara detta?

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Xinpei:

Eller... så är denna stämning ett skämt och folk stipulerar bara detta?

Jag håller med om att stämningen till en början ter sig rätt banal men i förlängningen så handlar det väl om vad som får kallas en kärna (core) eller inte. Jag tycker också att Nvidia borde ha blivit utsatt för en stämning i 4GB härvan med 970 kort av samma anledning att man vilseleder konsumenter till att tro att dom får en produkt med fullpresterande 4GB minne.

Permalänk
Medlem
Skrivet av MarkSix:

Jag håller med om att stämningen till en början ter sig rätt banal men i förlängningen så handlar det väl om vad som får kallas en kärna (core) eller inte. Jag tycker också att Nvidia borde ha blivit utsatt för en stämning i 4GB härvan med 970 kort av samma anledning att man vilseleder konsumenter till att tro att dom får en produkt med fullpresterande 4GB minne.

https://www.polygon.com/2016/7/28/12315238/nvidia-gtx-970-law...
https://www.nordichardware.se/nyheter/nvidia-doms-att-betala-...
Skickades från m.sweclockers.com

Visa signatur

sweclockers prestandaindex

Efter 10 kommer 11.
Efter 99 kommer 100.

Permalänk
Medlem
Skrivet av MarkSix:

Jag håller med om att stämningen till en början ter sig rätt banal men i förlängningen så handlar det väl om vad som får kallas en kärna (core) eller inte. Jag tycker också att Nvidia borde ha blivit utsatt för en stämning i 4GB härvan med 970 kort av samma anledning att man vilseleder konsumenter till att tro att dom får en produkt med fullpresterande 4GB minne.

Tror inte det juridiska systemet har kompetens nog att föra fram en fast definition när aktörerna själva inte fått hum om vad exakt en kärna är.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

@ClintBeastwood:

Det var nått jag missat eller glömt, men det var ju inga direkt avskräckande belopp dom fick punga ut med.

Permalänk
Medlem
Skrivet av Yoshman:

Som jag förstår detta fall så är det just frågan kring om fallen ens kvalificerar sig för att vara ett potentiellt problem. Verkar vara det man spendera ett par år på. T.ex. har man slagit fast att det är möjligt att beräkna värdet på "skadan".

Är först nu man ska utreda de tekniska bitar kring om marknadsföringen kan anses ha varit missledande.

Nu läste jag som hastigast men det där tycks handla om "prövningstillstånd" för att ta upp ett "class action"-mål. Alltså, ett beslut om att förutsättningarna finns för att behandla målet på detta vis. En del av detta är att det ska gå att beräkna värdet på skadan, men det är inget beslut om hur skadan ska beräknas och inte heller att domstolen senare kommer acceptera skadeberäkningen.

Permalänk
Skrivet av DJ-SAAB:

När jag köpte min FX-8350 så stod de 8 kärnor på Inet men öppnade man aktivitetshanteraren så va de bara 4 kärnor och 8 trådar istället.

Antingen så har nån på AMD varit så trött att inte orka skilja kärnor och trådar eller bara missförstått vad för processor de tillverkar och tro att man håller på med en 8 kärnig men är egentligen en 4 kärnig, eller bara helt enkelt fulspel.

Snarare Windows som tog det beslutet, för det gav bäst prestanda. Sen att AMD´s marknadsavdelning fulade sig är annan femma.

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem

Läste precis att AMD har gått med på att betala för detta nu.

"AMD has agreed to pay purchasers of its FX Bulldozer processors a total of $12.1m to settle a four-year false advertising lawsuit."

https://www.theregister.co.uk/2019/08/27/amd_chip_compensatio...

Visa signatur

I5 9600k@stock / Cooler Master Evo 212 / Gigabyte Z390 Gaming X / Corsair Vengeance LPX 16GB DDR4 3000MHz / MSI RTX2070 Gaming Z / EVGA 550 BQ / Asus VG27BQ 27" 165Hz

Ryzen 5 5600x@stock / Asus Rog Strix X570-E Gaming / Corsair Vengeance RGB Pro 16GB 3600MHz CL18 / MSI RTX3070 Suprim X / BeQuiet Pure Power 11 600W / Asus VG278Q 27" 144Hz