Permalänk
Datavetare
Skrivet av kaput:

Fast det var väl kanske inte de tekniska detaljerna jag var ute efter. Budskapet jag ville få fram var enbart att AMD vann popularitet ganska omedelbart efter att de började leverera de snabbaste propparna i konsumentsegmentet, dessutom till bättre priser än Intels motsvarigheter. Hur man lyckades uppnå det är irrelevant i frågan.

Den föregående situationen var väldigt snarlik dagens. Intel hade dominerat marknaden en längre tid, och AMD hade lågt igenkänningsvärde, men ändå vände det över en natt. Skulle Zen leverera på samma vis som K7, är det inte orimligt att tro att historien kommer upprepa sig.

Ah, makes sense. Att AMD faktiskt hade en tekniskt bättre CPU, oavsett hur man vred och vände på det, under Athlon-tiden gjorde å andra sidan det rätt mycket lättare att generera positiv buzz.

Att ha en "OK" produkt när man går upp mot marknadsledaren som sitter på en produkt som i de flesta fall är bättre ger ett visst motlut.

Men vi vet å andra sidan inte hur Zen presterar, även riktigt osannolika saker tenderar ju att hända. Fast rätt så sällan...

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Ah, makes sense. Att AMD faktiskt hade en tekniskt bättre CPU, oavsett hur man vred och vände på det, under Athlon-tiden gjorde å andra sidan det rätt mycket lättare att generera positiv buzz.

Att ha en "OK" produkt när man går upp mot marknadsledaren som sitter på en produkt som i de flesta fall är bättre ger ett visst motlut.

Men vi vet å andra sidan inte hur Zen presterar, även riktigt osannolika saker tenderar ju att hända. Fast rätt så sällan...

Näe, klart vi inte vet det, men om Hoppas kan man alltid, vore ju nice med lite riktig konkurrens, Intel har varit ohotade alldeles för länge nu.

Ja, och så får jag väl medge att jag har en liten faiblesse för AMD. Var alldeles för länge sedan man byggde något prestandaorienterat kring deras grejor. Har kvar min gamla XP2400+/KT133A-burk som var min senaste AMD-baserade "huvuddator", använder den numera som DOS/W98-monster. Rätt nice att köra Blood i 1280x1024

Visa signatur

Nu lurade jag dig att slösa bort ett par värdefulla sekunder av ditt liv på att läsa denna fullständigt poänglösa signatur!

Permalänk
Avstängd
Skrivet av Yoshman:

Har aldrig sagt att det inte finns områden där man kan dra nytta av många CPU-kärnor, men du pratar om en grupp som utgör mindre än en promille av totala marknaden. Givet totala storleken på marknaden är det ändå rätt många i absoluta tal. Använder själv ofta en dual E5-2690 (totalt 16 Sandy Bridge kärnor upp till 3,8 GHz) som arbetsstation, men bortsett från väldigt speciella fall så är faktiskt laptop med i7-5600U ungefär lika snabb (den presterar ungefär lika bra så länge man klarar sig med två kärnor, lista gärna alla program ni kan komma på där normalanvändaren har nytta av fler kärnor...).

Så din jämförelse bottnar i att en CPU med 16 kärnor inte är snabbare än en motsvarande på tex. 4st kärnor om du knappt använder dem?

Ganska så totalt ointressant jämförelse.

Det vore som att Bilsport skulle skriva Lamborghini Gallardo inte är snabbare än en Volvo C30 på 140Hk, i alla fall så länge ingen gasar.

Sedan skriver du om en promille, menar du här att det bara är en promille som ibland sysslar med bildbehandling eller har fler än 2st program igång på datorn?

Själv har jag för tillfället 74st processer igång på min PC.

Exempel på program skriver du?
Allt från bild och videobehandling till att komprimera data till att sortera data och kryptera och dekryptera data.

Finns massvis med exempel för den som inte blundar för det.

Edit: Som tur är görs inte prestandatester enligt din logik där CPUerna jämförs prestandamässigt då de knappt arbetar.

Permalänk
Medlem

Jag kör minst två firefoxsessioner åt gången samtidigt som jag kan ha minecraftserver och en virtuell PC i bakgrunden. Stänger inte ner något av de när jag startar spel. Spel som visat sig skala bortom 4 trådar.
Ibland vill jag köra någon videoredigering eller något annat grafiskt.
Vi är många som inte klarar oss på 2 kärnor och definitivt har stor nytta av mer än fyra. Som sagt så skalar moderna spel bortom fyra trådar.

Skulle tvärtom säga att den som bara kompilerar, kör heltalsintensiva program eller bara gör en sak åt gången är minoritet, eller använder en telefon.

Permalänk
Datavetare
Skrivet av Vingman:

Så din jämförelse bottnar i att en CPU med 16 kärnor inte är snabbare än en motsvarande på tex. 4st kärnor om du knappt använder dem?

Ganska så totalt ointressant jämförelse.

Det vore som att Bilsport skulle skriva Lamborghini Gallardo inte är snabbare än en Volvo C30 på 140Hk, i alla fall så länge ingen gasar.

Sedan skriver du om en promille, menar du här att det bara är en promille som ibland sysslar med bildbehandling eller har fler än 2st program igång på datorn?

Själv har jag för tillfället 74st processer igång på min PC.

Exempel på program skriver du?
Allt från bild och videobehandling till att komprimera data till att sortera data och kryptera och dekryptera data.

Finns massvis med exempel för den som inte blundar för det.

Edit: Som tur är görs inte prestandatester enligt din logik där CPUerna jämförs prestandamässigt då de knappt arbetar.

Att en promille av totala marknaden bildbehandlar på en nivå där CPU-valet spelar någon relevant roll är väldigt högt räknat. Att mer än en promille av marknaden överhuvudtaget bildbehandlar är kanske rimligt. Tänk på att det finns minst 1,5 miljard Windows-system (enligt Microsoft)!

Att köra flera processer går nödvändigtvis inte snabbare på fler kärnor, är extrem ovanligt att alla processer är CPU-bundna. Det vanligaste är att processerna är "idle", men är de I/O-bundna är oftast färre snabbare kärnor bättre.

Här är ett sådant exempel, trots att man kör fyra relativt CPU-krävande program parallellt är det ingen jätteskillnad mellan i3 och i7, i3-4130 är lika snabb som FX-8350.

Det normala folk kör på en PC är interaktiva applikationer, sådana applikationer kan i många lägen fortfarande vara krävande men deras flaskhals är att reagera på kortast möjliga tid på extern stimuli från användaren.

Det mest talande exemplet vi har på detta är mobilerna där Samsung m.fl. slår på trumma för "8-kärnor". Det ser också rätt OK ut i benchmarks som möjligen vore relevant om man använde sin telefon som som en server eller superdator.

Men precis som skrivbordsapplikationer på PC så kör mobiler främst interaktiva program där minimal latens är långt viktigare än maximal total beräkningskraft. Apple krossar inte motståndet för att iOS är bättre, de gör det för att ingen annan begriper hur man designar en CPU målmarknaden (Qualcomm håller på att ställa om, så finns hopp).

Edit: kan själv inget alls om tekniken bakom bildbehandling, men läste på lite snabbt om vad som spelar roll och Photoshop är ju både SIMD (SSE/AVX) och OpenCL (GPU) accelerated i de fall som skalar i det närmaste perfekt. "Lightroom" (vet inte ens vad det är, men nämndes också) är SIMD-optimerat, även för AVX2.

Så för bildbehandling verkar det minst lika viktigt att ha rätt grafikkort och bra SIMD som bra kapacitet över många kärnor.

Och kom att tänka på C2750 (8-kärnor Silvermont @ 2,4 GHz). Har ett sådant system på jobbet, är Atom men med 8-kärnor så är total kapacitet rätt bra. För interaktivt arbete är ändå C2750 väsentligt sämre än t.ex. m3-6Y30, den senare är nästan dubbelt så snabb så länge max två kärnor räcker men den senare har ändå ~50 % högre total kapacitet.

Det kritiska för Zen SR7 är att hamna tillräckligt nära i7-7700K (som i praktiken kommer vara huvudkonkurrent). Om SR7 är mer än 20-30 % långsammare per kärna är den tyvärr ett sämre köp för en absolut majoritet så länge den inte är billigare.

Slutligen: vad förutom bildbehandling och rendering (som båda allt mer accelereras via GPU och SIMD) existerar på skrivbordet där man kan ha relevant nytta av fler än fyra kärnor?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

nog tycker jag det är fullkomligt godkänt om den presterar som en i7 6700k det är en ny processor de tagit fram och en i7 6700k är 6e generationen? eller nåt ..

Visa signatur

4070 super - amd ryssen 5700x -
3070ti - intel 12700KF
laptop 3070ti

Permalänk
Medlem
Skrivet av Yoshman:

Det kritiska för Zen SR7 är att hamna tillräckligt nära i7-7700K (som i praktiken kommer vara huvudkonkurrent). Om SR7 är mer än 20-30 % långsammare per kärna är den tyvärr ett sämre köp för en absolut majoritet så länge den inte är billigare.

Slutligen: vad förutom bildbehandling och rendering (som båda allt mer accelereras via GPU och SIMD) existerar på skrivbordet där man kan ha relevant nytta av fler än fyra kärnor?

Här ett diagram som visar hur spel har relevant nytta av fler än fyra kärnor.

Notera hur en 5960X med sexton hårdvarustödda trådar på åtta kärnor med endast 3.0 GHz nästan orkar hålla jämt skägg med 6700K på 4.00 GHz och fyra kärnor och åtta trådar.

33% högre frekvens hos 6700K än 5960X.

(Bilden är från techspot.com.)

Spel är alltså en sådan kategori där fler kärnor hjälper.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Yoshman:

Att en promille av totala marknaden bildbehandlar på en nivå där CPU-valet spelar någon relevant roll är väldigt högt räknat. Att mer än en promille av marknaden överhuvudtaget bildbehandlar är kanske rimligt. Tänk på att det finns minst 1,5 miljard Windows-system (enligt Microsoft)!

Att köra flera processer går nödvändigtvis inte snabbare på fler kärnor, är extrem ovanligt att alla processer är CPU-bundna. Det vanligaste är att processerna är "idle", men är de I/O-bundna är oftast färre snabbare kärnor bättre.

Här är ett sådant exempel, trots att man kör fyra relativt CPU-krävande program parallellt är det ingen jätteskillnad mellan i3 och i7, i3-4130 är lika snabb som FX-8350.

Det normala folk kör på en PC är interaktiva applikationer, sådana applikationer kan i många lägen fortfarande vara krävande men deras flaskhals är att reagera på kortast möjliga tid på extern stimuli från användaren.

Det mest talande exemplet vi har på detta är mobilerna där Samsung m.fl. slår på trumma för "8-kärnor". Det ser också rätt OK ut i benchmarks som möjligen vore relevant om man använde sin telefon som som en server eller superdator.

Men precis som skrivbordsapplikationer på PC så kör mobiler främst interaktiva program där minimal latens är långt viktigare än maximal total beräkningskraft. Apple krossar inte motståndet för att iOS är bättre, de gör det för att ingen annan begriper hur man designar en CPU målmarknaden (Qualcomm håller på att ställa om, så finns hopp).

Edit: kan själv inget alls om tekniken bakom bildbehandling, men läste på lite snabbt om vad som spelar roll och Photoshop är ju både SIMD (SSE/AVX) och OpenCL (GPU) accelerated i de fall som skalar i det närmaste perfekt. "Lightroom" (vet inte ens vad det är, men nämndes också) är SIMD-optimerat, även för AVX2.

Så för bildbehandling verkar det minst lika viktigt att ha rätt grafikkort och bra SIMD som bra kapacitet över många kärnor.

Och kom att tänka på C2750 (8-kärnor Silvermont @ 2,4 GHz). Har ett sådant system på jobbet, är Atom men med 8-kärnor så är total kapacitet rätt bra. För interaktivt arbete är ändå C2750 väsentligt sämre än t.ex. m3-6Y30, den senare är nästan dubbelt så snabb så länge max två kärnor räcker men den senare har ändå ~50 % högre total kapacitet.

Det kritiska för Zen SR7 är att hamna tillräckligt nära i7-7700K (som i praktiken kommer vara huvudkonkurrent). Om SR7 är mer än 20-30 % långsammare per kärna är den tyvärr ett sämre köp för en absolut majoritet så länge den inte är billigare.

Slutligen: vad förutom bildbehandling och rendering (som båda allt mer accelereras via GPU och SIMD) existerar på skrivbordet där man kan ha relevant nytta av fler än fyra kärnor?

kan denna infon ge något om prestandan?
http://wccftech.com/amd-zen-naples-soc-benchmarks/
http://wccftech.com/amd-zen-16-core-cpu-pictured/

Visa signatur

Ryzen 5800X ROG STRIX X570-f GAMING FlareX DDR43600 cl 14-14-14-34 EVGA FTW3 Ultra RTX 3090

Permalänk
Datavetare
Skrivet av sAAb:

Här ett diagram som visar hur spel har relevant nytta av fler än fyra kärnor.

Notera hur en 5960X med sexton hårdvarustödda trådar på åtta kärnor med endast 3.0 GHz nästan orkar hålla jämt skägg med 6700K på 4.00 GHz och fyra kärnor och åtta trådar.

33% högre frekvens hos 6700K än 5960X.
http://www.techspot.com/articles-info/1263/bench/CPU_03.png

(Bilden är från techspot.com.)

Spel är alltså en sådan kategori där fler kärnor hjälper.

Notera att 4960X är snabbare än 5960X, orsak? Den förra har max turbo på 4,0 GHz medan den andra maxar på 3,5 GHz. Så skillnaden mellan 6700K och 4960X är i princip exakt den skillnad de har i prestanda per kärna med max turbo -> d.v.s. finns överhuvudtaget ingen vinst över 4 kärnor + HT.

Flera har noterat att Gears of War 4 uppför sig udda just kring i5 vs i7. Om det verkligen är lysande skalning med kärnor vi ser, hur kommer det sig att i3-6100 i princip helt matchar i5-4690K och FX-8350?

Vad vi har sett är att vissa spel gillar mycket CPU-cache, något som i7-5775C är ett bra bevis på, men skillnaden är mindre än man kan tro, har själv en sådan och i spel ligger den typiskt på sin maxturbo på 3,7 GHz vilket visar att spelen inte använder alla fyra kärnor fullt ut.

Även om Amdahls lag ofta missförstås är den väldigt illustrativ. Notera att Amdahls lag verkligen är en lag i fysisk bemärkelse, givet den abstraktion som används är det omöjligt att få en större utväxling från ett visst antal kärnor givet en viss andel av programmet som måste köras seriellt.

I praktiken är Amdahls en överskattning då den förutsätter att storleken på den seriella delen är oberoende av antal CPU-kärnor. I verkligheten sänks frekvensen ju fler kärnor som jobbar samt att ta/släppa lås (mutex/sempahores) är flera gånger dyrare när mer än en kärna är inblandad.

Exempel på vad man kan räkna ut med denna lag är: ställ två system mot varandra, en med 4 kärnor och en med 8 kärnor, anta att båda kör med SMT som ger ~25 % extra boost och antar att 80 % av tiden kör man saker som skalar perfekt med CPU-kärnor.

Båda systemen presterar då exakt lika bra om det systemet med 4 kärnor har 26 % högre enkeltrådprestanda (och notera att detta är ett absolut teoretisk max, i praktiken är det klart mindre än 26 % som krävs). Detta är ännu en orsak varför färre snabba kärnor är bättre för skrivbordet, få applikationer kan ens nå den graden av parallellism.

Däremot har många serverapplikationer >90 % som kan köras parallellt, det man kör på superdatorer måste ha en parallell-grad en bra bit förbi 99,9 % vilket begränsar vad man kan göra en hel del.

Säger inte speciellt mycket, Geekbench resultatet är heltskumt i enkeltrådfallet, långt lägre än vad det borde om den verkligen kördes på de 2,9 GHz som nämns i artikeln. Gissar att den kretsen alltid kör på basklock 1,44 GHz, fast även då är det väl lågt när man jämför med t.ex. m3 6Y30 (Skylake med maxfrekvens på 2,2 GHz) som har ca 2680 poäng i enkeltrådat fall.

Om detta stämmer skulle Skylake har ~50 % högre IPC jämfört med Zen, vilket känns som en orimligt stor skillnad.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Notera att 4960X är snabbare än 5960X, orsak? Den förra har max turbo på 4,0 GHz medan den andra maxar på 3,5 GHz. Så skillnaden mellan 6700K och 4960X är i princip exakt den skillnad de har i prestanda per kärna med max turbo -> d.v.s. finns överhuvudtaget ingen vinst över 4 kärnor + HT.

Flera har noterat att Gears of War 4 uppför sig udda just kring i5 vs i7. Om det verkligen är lysande skalning med kärnor vi ser, hur kommer det sig att i3-6100 i princip helt matchar i5-4690K och FX-8350?

Vad vi har sett är att vissa spel gillar mycket CPU-cache, något som i7-5775C är ett bra bevis på, men skillnaden är mindre än man kan tro, har själv en sådan och i spel ligger den typiskt på sin maxturbo på 3,7 GHz vilket visar att spelen inte använder alla fyra kärnor fullt ut.

Även om Amdahls lag ofta missförstås är den väldigt illustrativ. Notera att Amdahls lag verkligen är en lag i fysisk bemärkelse, givet den abstraktion som används är det omöjligt att få en större utväxling från ett visst antal kärnor givet en viss andel av programmet som måste köras seriellt.

I praktiken är Amdahls en överskattning då den förutsätter att storleken på den seriella delen är oberoende av antal CPU-kärnor. I verkligheten sänks frekvensen ju fler kärnor som jobbar samt att ta/släppa lås (mutex/sempahores) är flera gånger dyrare när mer än en kärna är inblandad.

Exempel på vad man kan räkna ut med denna lag är: ställ två system mot varandra, en med 4 kärnor och en med 8 kärnor, anta att båda kör med SMT som ger ~25 % extra boost och antar att 80 % av tiden kör man saker som skalar perfekt med CPU-kärnor.

Båda systemen presterar då exakt lika bra om det systemet med 4 kärnor har 26 % högre enkeltrådprestanda (och notera att detta är ett absolut teoretisk max, i praktiken är det klart mindre än 26 % som krävs). Detta är ännu en orsak varför färre snabba kärnor är bättre för skrivbordet, få applikationer kan ens nå den graden av parallellism.

Däremot har många serverapplikationer >90 % som kan köras parallellt, det man kör på superdatorer måste ha en parallell-grad en bra bit förbi 99,9 % vilket begränsar vad man kan göra en hel del.

Säger inte speciellt mycket, Geekbench resultatet är heltskumt i enkeltrådfallet, långt lägre än vad det borde om den verkligen kördes på de 2,9 GHz som nämns i artikeln. Gissar att den kretsen alltid kör på basklock 1,44 GHz, fast även då är det väl lågt när man jämför med t.ex. m3 6Y30 (Skylake med maxfrekvens på 2,2 GHz) som har ca 2680 poäng i enkeltrådat fall.

Om detta stämmer skulle Skylake har ~50 % högre IPC jämfört med Zen, vilket känns som en orimligt stor skillnad.

Att alla kärnor inte används i alla spel är tyvärr sant även i spel där de borde användas, tex Civ 6. Här en obehaglig tråd, för oss förväntansfulla och nästa(n) Zen-köpare:

https://m.reddit.com/r/civ/comments/5dlu3j/i_measured_how_civ...

En av kommentarerna:

Citat:

My almighty 6850k is sad with this news

Det varierar nog rejält.

Imponerar Zen 13 december så kanske även en Naples kan spelas på:

http://wccftech.com/amd-zen-16-core-cpu-pictured/

Men, frekvensen är kanske lite väl låg för spel och annat.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av sAAb:

Att alla kärnor inte används i alla spel är tyvärr sant även i spel där de borde användas, tex Civ 6. Här en obehaglig tråd, för oss förväntansfulla och nästa(n) Zen-köpare:

https://m.reddit.com/r/civ/comments/5dlu3j/i_measured_how_civ...

En av kommentarerna:

Det varierar nog rejält.

Imponerar Zen 13 december så kanske även en Naples kan spelas på:

http://wccftech.com/amd-zen-16-core-cpu-pictured/

Men, frekvensen är kanske lite väl låg för spel och annat.

Grejen är ju den att strategispel inte automatiskt skalar bra då datorn inte kan räkna ut vad civilisation 2 ska göra innan civilisation 1 gjort sitt drag. Detsamma gäller säkert enheter inom en AI civ då enhet 2 måste veta vart enhet 1 är innan denna kan flytta sig. Annars kan dom flyttas till samma ruta.

Det blir därmed svårt att ta nytta av flera cores. Det är precis samma dilemma som jag har när jag simulerar bränder med hjälp av CFD-beräkningar. Där är rummet uppdelat i många kuber och man kan tycka att det bara är att tilldela varje core eller thread en del av rummet att simulera. Dock funkar inte det utan för att kub 2 ska veta hur mycket värme och flöde som finns in den måste det först räknas ut för kub 1 och även omgivande kuber.

RTS är isf en lättare uppgift för en processor då enheterna oftast rör på sig oberoende av varandra och ne AI gör flera drag samtidigt.

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360.
#ryssjävlar

Permalänk
Medlem
Skrivet av heatm:

Grejen är ju den att strategispel inte automatiskt skalar bra då datorn inte kan räkna ut vad civilisation 2 ska göra innan civilisation 1 gjort sitt drag. Detsamma gäller säkert enheter inom en AI civ då enhet 2 måste veta vart enhet 1 är innan denna kan flytta sig. Annars kan dom flyttas till samma ruta.

Det blir därmed svårt att ta nytta av flera cores. Det är precis samma dilemma som jag har när jag simulerar bränder med hjälp av CFD-beräkningar. Där är rummet uppdelat i många kuber och man kan tycka att det bara är att tilldela varje core eller thread en del av rummet att simulera. Dock funkar inte det utan för att kub 2 ska veta hur mycket värme och flöde som finns in den måste det först räknas ut för kub 1 och även omgivande kuber.

RTS är isf en lättare uppgift för en processor då enheterna oftast rör på sig oberoende av varandra och ne AI gör flera drag samtidigt.

Hmmm. Deep Blue, your move.

Schack är väl ett typiskt exempel på hur det borde vara möjligt med lite brute force.

Mahathma Gandhi just annihilated France, Russia and The Aztecs. Your turn.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av sAAb:

Hmmm. Deep Blue, your move.

Schack är väl ett typiskt exempel på hur det borde vara möjligt med lite brute force.

Mahathma Gandhi just annihilated France, Russia and The Aztecs. Your turn.

Jo, visst kan man räkna ut 1000-tals olika turnutgångar och välja den bästa. Jag tror dock att speltillverkare har liiiite mer krav på att spelen ska funka på annat än superdatorer. Dom hade dock kunnat göra AIn bra mycket bättre för den är fan inte bra som den är idag.

Så turnen går över till dig.

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360.
#ryssjävlar

Permalänk
Medlem
Skrivet av heatm:

Jo, visst kan man räkna ut 1000-tals olika turnutgångar och välja den bästa. Jag tror dock att speltillverkare har liiiite mer krav på att spelen ska funka på annat än superdatorer. Dom hade dock kunnat göra AIn bra mycket bättre för den är fan inte bra som den är idag.

Så turnen går över till dig.

Jag misstänker att med Civ VI har de snålat rejält. Till och med kartorna på på Huge är mindre... Här en tråd om det https://forums.civfanatics.com/threads/why-are-the-maps-so-sm... Man har sänkt max-antalet "tiles" på Huge från 128x80 106x66 rutor... Det blir nog inget Civ 6... Till och med de gamla rektangelrutorna var bättre, med 8 vägar att gå. Kombinatoriken har fått ge vika för grafiken, eller?!

Det förvånar mig att CFD-beräkningar inte skalar bra. Skulle det inte betyda att IPCC sitter med senaste desktop-CPUn och inte med ett Xeon-kluster?! Det låter som ett initieringsproblem, vilket start-värde skall man utgå från samt hur många omberäkningar enligt bayesiansk modell är man beredd att göra.

I mina jultindrande ögon skulle Zen kunna vara en fattigmanssuperdator, vilket jag fortfarande hoppas på. Jag har egna användningsfall som sväljer än mer och är fortfarande sugen. 6900K är för dyr och för lite prestanda gentemot 6700K och det är där Zen-drömmarna hamnar. Fan, för tiotusen är AMD Naples ett alternativ!!! sAAb, the Zenmaster?!

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Yoshman:

Att en promille av totala marknaden bildbehandlar på en nivå där CPU-valet spelar någon relevant roll är väldigt högt räknat. Att mer än en promille av marknaden överhuvudtaget bildbehandlar är kanske rimligt. Tänk på att det finns minst 1,5 miljard Windows-system (enligt Microsoft)!

Att köra flera processer går nödvändigtvis inte snabbare på fler kärnor, är extrem ovanligt att alla processer är CPU-bundna. Det vanligaste är att processerna är "idle", men är de I/O-bundna är oftast färre snabbare kärnor bättre.

Här är ett sådant exempel, trots att man kör fyra relativt CPU-krävande program parallellt är det ingen jätteskillnad mellan i3 och i7, i3-4130 är lika snabb som FX-8350.

Det normala folk kör på en PC är interaktiva applikationer, sådana applikationer kan i många lägen fortfarande vara krävande men deras flaskhals är att reagera på kortast möjliga tid på extern stimuli från användaren.

Det mest talande exemplet vi har på detta är mobilerna där Samsung m.fl. slår på trumma för "8-kärnor". Det ser också rätt OK ut i benchmarks som möjligen vore relevant om man använde sin telefon som som en server eller superdator.

Men precis som skrivbordsapplikationer på PC så kör mobiler främst interaktiva program där minimal latens är långt viktigare än maximal total beräkningskraft. Apple krossar inte motståndet för att iOS är bättre, de gör det för att ingen annan begriper hur man designar en CPU målmarknaden (Qualcomm håller på att ställa om, så finns hopp).

Edit: kan själv inget alls om tekniken bakom bildbehandling, men läste på lite snabbt om vad som spelar roll och Photoshop är ju både SIMD (SSE/AVX) och OpenCL (GPU) accelerated i de fall som skalar i det närmaste perfekt. "Lightroom" (vet inte ens vad det är, men nämndes också) är SIMD-optimerat, även för AVX2.

Så för bildbehandling verkar det minst lika viktigt att ha rätt grafikkort och bra SIMD som bra kapacitet över många kärnor.

Och kom att tänka på C2750 (8-kärnor Silvermont @ 2,4 GHz). Har ett sådant system på jobbet, är Atom men med 8-kärnor så är total kapacitet rätt bra. För interaktivt arbete är ändå C2750 väsentligt sämre än t.ex. m3-6Y30, den senare är nästan dubbelt så snabb så länge max två kärnor räcker men den senare har ändå ~50 % högre total kapacitet.

Det kritiska för Zen SR7 är att hamna tillräckligt nära i7-7700K (som i praktiken kommer vara huvudkonkurrent). Om SR7 är mer än 20-30 % långsammare per kärna är den tyvärr ett sämre köp för en absolut majoritet så länge den inte är billigare.

Slutligen: vad förutom bildbehandling och rendering (som båda allt mer accelereras via GPU och SIMD) existerar på skrivbordet där man kan ha relevant nytta av fler än fyra kärnor?

samt

Skrivet av Yoshman:

Notera att 4960X är snabbare än 5960X, orsak? Den förra har max turbo på 4,0 GHz medan den andra maxar på 3,5 GHz. Så skillnaden mellan 6700K och 4960X är i princip exakt den skillnad de har i prestanda per kärna med max turbo -> d.v.s. finns överhuvudtaget ingen vinst över 4 kärnor + HT.

Flera har noterat att Gears of War 4 uppför sig udda just kring i5 vs i7. Om det verkligen är lysande skalning med kärnor vi ser, hur kommer det sig att i3-6100 i princip helt matchar i5-4690K och FX-8350?

Vad vi har sett är att vissa spel gillar mycket CPU-cache, något som i7-5775C är ett bra bevis på, men skillnaden är mindre än man kan tro, har själv en sådan och i spel ligger den typiskt på sin maxturbo på 3,7 GHz vilket visar att spelen inte använder alla fyra kärnor fullt ut.

Även om Amdahls lag ofta missförstås är den väldigt illustrativ. Notera att Amdahls lag verkligen är en lag i fysisk bemärkelse, givet den abstraktion som används är det omöjligt att få en större utväxling från ett visst antal kärnor givet en viss andel av programmet som måste köras seriellt.

I praktiken är Amdahls en överskattning då den förutsätter att storleken på den seriella delen är oberoende av antal CPU-kärnor. I verkligheten sänks frekvensen ju fler kärnor som jobbar samt att ta/släppa lås (mutex/sempahores) är flera gånger dyrare när mer än en kärna är inblandad.

Exempel på vad man kan räkna ut med denna lag är: ställ två system mot varandra, en med 4 kärnor och en med 8 kärnor, anta att båda kör med SMT som ger ~25 % extra boost och antar att 80 % av tiden kör man saker som skalar perfekt med CPU-kärnor.

Båda systemen presterar då exakt lika bra om det systemet med 4 kärnor har 26 % högre enkeltrådprestanda (och notera att detta är ett absolut teoretisk max, i praktiken är det klart mindre än 26 % som krävs). Detta är ännu en orsak varför färre snabba kärnor är bättre för skrivbordet, få applikationer kan ens nå den graden av parallellism.

Däremot har många serverapplikationer >90 % som kan köras parallellt, det man kör på superdatorer måste ha en parallell-grad en bra bit förbi 99,9 % vilket begränsar vad man kan göra en hel del.

Säger inte speciellt mycket, Geekbench resultatet är heltskumt i enkeltrådfallet, långt lägre än vad det borde om den verkligen kördes på de 2,9 GHz som nämns i artikeln. Gissar att den kretsen alltid kör på basklock 1,44 GHz, fast även då är det väl lågt när man jämför med t.ex. m3 6Y30 (Skylake med maxfrekvens på 2,2 GHz) som har ca 2680 poäng i enkeltrådat fall.

Om detta stämmer skulle Skylake har ~50 % högre IPC jämfört med Zen, vilket känns som en orimligt stor skillnad.

Just skrivbordsapplikationer vinner säkert på färre men snabbare.

Amdahls och Gustafssons lagar är enligt Shi samma sak och visst det blir nog mycket server-liknande arbete för Zen, med all rätt.

Själv kan jag tänka mig att även få simuleringar piggare, men det är knappast allmänhetens skrivbord.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Datavetare
Skrivet av sAAb:

Just skrivbordsapplikationer vinner säkert på färre men snabbare.

Amdahls och Gustafssons lagar är enligt Shi samma sak och visst det blir nog mycket server-liknande arbete för Zen, med all rätt.

Själv kan jag tänka mig att även få simuleringar piggare, men det är knappast allmänhetens skrivbord.

Gustafssons lag är samma matematiska uttryck som Amdahls, det enda som skiljer är vilka parametrar man sätter som variabler.

Amdahls lag är bäst när din fråga är: givet fördelningen av seriell och parallell andel i detta specifika program, vad är den maximala vinst kan se från N st CPU-kärnor

Gustafssons lag är bäst när din fråga är: hur stor måste den parallella delen vara för att jag ska se minst Y gångers ökning på mitt system med N st CPU-kärnor

D.v.s i Amdals lag är problemets storlek konstant, i Gustafssons tittar man på hur stort problemet måste vara för att nå en viss effektivitet.

Är sällan man kan göra speciellt mycket åt problemets storlek på skrivbordet, man kör de applikationer man har på den data man har. På servers går storleken typiskt att variera genom att designa det hela för fler användare (som typiskt ökar tiden man spenderar i den parallella delen).

Skrivet av sAAb:

Schack är väl ett typiskt exempel på hur det borde vara möjligt med lite brute force.

Visst går det, men tittar man på branching factor för antal möjlig fall i schack inser man direkt att en fördubbling och även en tiofaldig ökning av beräkningskraft ger en minimal ökning i sökdjup om man använder sig av brute force. Det är i praktiken värdelöst.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Har det kommit information om antalet kärnor/threads som de olika versionerna kommer att ha? Vad är antalet på exempelvis versionen som ska konkurrera med intels 6700K/7700K?

Permalänk
Medlem
Skrivet av Yoshman:

Visst går det, men tittar man på branching factor för antal möjlig fall i schack inser man direkt att en fördubbling och även en tiofaldig ökning av beräkningskraft ger en minimal ökning i sökdjup om man använder sig av brute force. Det är i praktiken värdelöst.

Värdelöst?! Nej. Man får väl undvika https://en.wikipedia.org/wiki/NP-hardness och köra heuristics, och då brukar man komma framåt ändå. Med rätt heuristics hjälper Zen.

Men, visst finns det ett gränsvärde, break-even när det ena tar ut det andra. Det gäller även branch-prediction - Hur djupa får de vara? P4 och Core 2 är väl olika skolor om jag kommer ihåg rätt.

Önskelandet hägrar.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Datavetare
Skrivet av sAAb:

Värdelöst?! Nej. Man får väl undvika https://en.wikipedia.org/wiki/NP-hardness och köra heuristics, och då brukar man komma framåt ändå. Med rätt heuristics hjälper Zen.

Men, visst finns det ett gränsvärde, break-even när det ena tar ut det andra. Det gäller även branch-prediction - Hur djupa får de vara? P4 och Core 2 är väl olika skolor om jag kommer ihåg rätt.

Önskelandet hägrar.

Min invändning var mot att använda "brute force", det är värdelöst och just därför använder man sig i praktiken av heuristik för att tidigt ta bort vägar som inte ser ut att vara bra (men är då möjligt att missa den optimala lösningen). Så tänkte "brute force" != "lösning med en hel del heuristik".

En ren "brute force" lösning av schack skulle på ett effektivt kunna använda miljontals CPU-kärnor, men skulle ändå vara värdelös just p.g.a. branching-factor för antalet möjliga lösningar (menade alltså inte branches i en CPU). En "smart" lösning minskar skalning rätt rejält, men då schack är som det är kan man ändå utan problem använda åtskilliga tusentals kärnor väldigt effektivt.

Så kanske missförstod det hela, självklart kan Zens 8 kärnor användas med nära nog 100 % effektivitet just till schack, även med en "smart" algoritm.

Finns ju en benchmark med namnet Queen som är del i AIDA64, skulle vara intressant att se resultat för Zen i denna. Inte just för att det skalar väl utan för att denna benchmark har visat sig vara en bra indikator på kvalitén hos branch-predictor i CPUn. Designer med en dålig sådan presterar illa i detta test (men skalar fortfarande linjärt med antal kärnor).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

16 kärnig Zen "Naples".

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Enigma:

Men sätta sitt namn på en bild som cirkulerat ett par dagar?

Permalänk
Medlem

Varför lägger du in ditt nick där då bilden cirkulerat på hela internet i två dagar redan och dessutom redan är länkad i tråden?

Permalänk
Medlem

Vi påminna om en tidigare tråd http://www.sweclockers.com/forum/trad/1418787-zen-for-desktop... där följande bild fanns:

16 kärnor betyder ju AMD Naples. Med överklockning!!!

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem

@Aleshi: Mest för att irritera

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Gainsgoblin:

Varför lägger du in ditt nick där då bilden cirkulerat på hela internet i två dagar redan och dessutom redan är länkad i tråden?

Mest för att irritera då alla skvallersidor gör det som att det är en del av deras "exclusive material" Kanske det stör dig mer än dom

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem

24h grabbar och vi får se live hur bra denna blir, förhoppningsvis visar de Vega också.

Visa signatur

| ASUS ROG Crosshari VIII Dark Hero | AMD Ryzen 5950X | Noctua D15 Chromax | G.Skill TridentZ Royal Gold 32GB DDR4 @ 3600Mhz CL14 | PowerColor Radeon RX 9070 XT 16GB Reaper | 2x WD SN850 1TB @RAID 0 + 2x Samsung 860 EVO 1TB @RAID 0 | Corsair HX 1000W | Corsair Obsidian 1000D | LG 34GN850 |

Monitor Audio Platinum PL100 II + Marantz Cinema 60
Klipsch R-115SW
Sennheiser HD650

Permalänk
Medlem
Skrivet av GarfieldPower:

24h grabbar och vi får se live hur bra denna blir, förhoppningsvis visar de Vega också.

Snarare 48 timmar.
Och mycket av prestandan får vi nog vänta till lansering på.
Men jag gissar på 10-20% ifrån Skylake i IPC i snitt. Och angående frekvenser så matchar de rätt bra för de 8-kärniga men att de inte skalar lika bra frekvensmässigt. Så de fyrkärniga kommer ligga efter märkbart på den punkten när de släpps och överklockning kommer inte gå lika lätt.

Permalänk
Inaktiv
Skrivet av Aleshi:

Snarare 48 timmar.
Och mycket av prestandan får vi nog vänta till lansering på.
Men jag gissar på 10-20% ifrån Skylake i IPC i snitt. Och angående frekvenser så matchar de rätt bra för de 8-kärniga men att de inte skalar lika bra frekvensmässigt. Så de fyrkärniga kommer ligga efter märkbart på den punkten när de släpps och överklockning kommer inte gå lika lätt.

Fattas väl bara att jag kommer ångra mitt Skylake-köp rejält. Köpte inte den för att jag ville ha den utan för att gamla plattformen genererade fel och behövde bytas. Inte för att det utesluter att jag byter plattform en gång till.

Riktigt spännande, hoppas personligen på att AMD överraskar rejält, marknaden behöver jämnas ut. Och vem vill inte sitta på ett riktigt kraftfullt AMD-system igen?

Permalänk
Medlem

Ska bli intressant att se vad AMD faktiskt visar, hoppas det är ett mer givande event än RX480 eventet.

Permalänk
Medlem
Skrivet av sAAb:

Jag misstänker att med Civ VI har de snålat rejält. Till och med kartorna på på Huge är mindre... Här en tråd om det https://forums.civfanatics.com/threads/why-are-the-maps-so-sm... Man har sänkt max-antalet "tiles" på Huge från 128x80 106x66 rutor... Det blir nog inget Civ 6... Till och med de gamla rektangelrutorna var bättre, med 8 vägar att gå. Kombinatoriken har fått ge vika för grafiken, eller?!

Det förvånar mig att CFD-beräkningar inte skalar bra. Skulle det inte betyda att IPCC sitter med senaste desktop-CPUn och inte med ett Xeon-kluster?! Det låter som ett initieringsproblem, vilket start-värde skall man utgå från samt hur många omberäkningar enligt bayesiansk modell är man beredd att göra.

I mina jultindrande ögon skulle Zen kunna vara en fattigmanssuperdator, vilket jag fortfarande hoppas på. Jag har egna användningsfall som sväljer än mer och är fortfarande sugen. 6900K är för dyr och för lite prestanda gentemot 6700K och det är där Zen-drömmarna hamnar. Fan, för tiotusen är AMD Naples ett alternativ!!! sAAb, the Zenmaster?!

Problemet med dom CFD-beräkningarna jag gör är att dom i grunden försöker vara så exakta som möjligt och för att få bäst resultat utan en massa förenklingar så är det singeltrådat som gäller.

Det finns möjlighet att köra flera trådar men förenklar man inte modellen så ger det inget nämnvärt i fråga om tidsåtgång.

För att tjäna något så måste man dela in "rummet" man simulerar i olika "meshes" som vardera består av en "grid" av kuber. Man delar rumkuben i fyra mindre kuber som 4 processorkärnor räknar på samtidigt. Dock innebär detta att gränserna mellan kuberna förenklas, framförallt när det gäller flödet (som är extremt jobbigt att beräkna (framförallt de turbulenta flödena samt partiklar som sot och olika gasblandningar). Sätter man dessa gränser där det riskerar att bli mycket stökiga flöden så kan man få helt fel resultat. Oftast kör man singeltrådat med mindre krävande modeller sen ökar man sakta noggrannheten och tillslut, när beräkningarna tar för lång tid så delar man inte rummet till de olika CPU-kärnorna. Blir resultaten ungefär lika som när man körde enkelttrådat så kan man börja skala upp det igen.

Fan, jobbigt att förklara på svenska då det alltid är engelska man håller på med.

Jag är dock ingen expert på varför det inte går och heller ingen expert på programmet. Finns folk som sitter med det dagarna i enda dock, dom vet nog mer. Programmet använder sig av Large Eddy Simulation (LED) iaf för att beräkna det turbulenta flödet. Räknar man på väldigt små bränder där griden består av 1 mm3 stora kuber typ så används Direct Numerical Simulation (DNS). Det är oftast flödet som brakar ihop om man inte är försiktig när man delar upp rummet för fler processer.

Man kan alltså dela upp simuleringarna på i stort sätt hur många processer och datorer som helst, oftast så så kör man 8 st på en i7 t.ex. Gör man större beräkningar kan man använda sig av superdatorer om man så vill. Något man måste om man ska simulera något extremt. Knappast något en konsult som jag gör. Det gäller bara att veta vad man gör innan.

Det är mycket med det där.

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360.
#ryssjävlar