AMD A10-7850K och A10-7700K "Kaveri" – specifikationer läcker ut

Permalänk
Medlem
Skrivet av Kärlekstrollet:

Trodde inte detta behövdes säga igen men TDP kan inte jämföras med strömförbrukning.

Lika mycket som TDP inte kan jämföras med värmeutveckling.

Permalänk
Medlem
Skrivet av Yoshman:

Men man ska komma igång att det är bara de minnesaccesser som missar CPU-cache där denna skillnad överhuvudet spelar roll. Och jämfört med L2- och framförallt L1-cache så är latensen mot RAM väldigt hög, så program som inte har väldigt hög cache-hit-rate kommer prestera bedrövligt. Man ska också komma ihåg att en hel slumpmässig minnesaccess kommer antagligen behöva byta rad också, så då har man "close row", "open new row", "select column", "data.." vilket betyder väldigt mycket latens.

Jag vet inte hur relevant jämförelsen är...
Men om man tittar på hårddiskar, så har man både access tid och överföringshastighet där också.
I fallet med hårddiskar så är det vanligtvis ganska stor skillnad i hur stor throughput man får om det är många små filer som ska hittas och sen läsas eller skrivas, jämfört med om det är få större filer där man har större del sekventiell läsning/skrivning.

Finns det någon form av motsvarighet till sekventiell läsning/skrivning på ram?
Att om det är en större mängd sammanhängande data så går det snabbare än om det är mycket små 'filer' överallt ?

Jag tänkte då att latenserna kan spela mer eller mindre roll beroende på hur minnet ska användas?
Att för vissa användningsområden kan latenserna ha större betydelse och andra mindre?
I så fall kanske lite sämre latenser inte alltid innebär bedrövlig prestanda rent praktiskt ?

Permalänk
Medlem
Skrivet av Kärlekstrollet:

Trodde inte detta behövdes säga igen men TDP kan inte jämföras med strömförbrukning.

TDP (Thermal Design Power) är ett värde efter hur mycket värme kylare måste kunna avleda.
Eftersom TDP vanligtvis inte specificeras specifikt för varje modell, utan mer för ett segment av en produktfamilj så blir det ett lite trubbigt verktyg, när det kommer till att säga hur mycket ström en processor drar.

Däremot så kan man i princip sätta likhetstecken mellan strömförbrukning och värmeutveckling i en processor eftersom i stort sett all strömförbrukning omvandlas till värme.

Fast är det inte så redan på Richland att AMD jobbade mot TDP värdet, att klockfrekvenser på både CPU del och GPU del justerades mot TDP värdet, efter behov.
Så att vid belastning kunde de ligga ganska nära TDP värdet.

I så fall är uttalanden i stil med att TDP och strömförbrukning inte är samma sak fortfarande principiellt sant. Men i praktiken mer relevant på den tiden man inte hade olika dynamiska "turbo" funktioner.

Permalänk
Medlem

virtual void

5500MHz GDDR5 bör nog ha en CL på 18. Nu vet vi väl att X1 kör sina minnen i 2133, men det betyder att när den så gör så har den använt CL14. Båda bör ligga runt 13 ns. Ska de under 11ns måste de ligga långt över både minnestillverkarens specifikationer och JEDEC. Det är mycket mer som skiljer däremot. Det som ger mer bandbredd är också hur och vad som får tillgång till banbredden av minneskontrollern, både PS4 och X1 så är det vitt skilda saker att från CPU till minne och GPU till minne, och olika snabbt. GDDR5 ger möjlighet för PS4an att ha dubbla bandbredden. Processorn ser det bara som en 20GiB/s buss däremot medan grafiken kan använda all bandbredd. Det fungerar inte så på enklare integrerade grafikkretsar. Allt minne där är processorns, dito extern L4 hos Intel. Det är ju dessutom grafikkretsarna de vill ska fungera som kraftigare kort med eget minne, att då försöka lösa bandbredden med några MB eSRAM är inte samma sak. Men är säkert en bra lösning om de också lägger ner tid på det, och anpassar mjukvaran därefter.

Kaveri kommer dela upp minnet i olika bussar också dock. Vilket betyder att det blir lättare att jobba mellan gpu och cpu och vise versa aka HSA, men det blir inte fulla bandbandbredden troligen. Men där måste cpu:n ha full bandbredd däremot. Så det blir ändå lite av en annan grej.

Zotamedu

Inlägget var bara för att demonstrera att det inte skulle vara någon vits, oavsett sockel/BGA. Att det inte går att göra det på ett rimligt sett. Meningen måste rimligen vara att minska antalet komponenter på kretskortet, och då blir det MCM eller PoP-förpackningar utöver att integrera mer i samma kisel. Men det är inte riktigt rimligt att stoppa in allt på samma chip, det är inte direkt önskvärt och även om du gör det med grafikminnet så har du kvar FCH och massor annat. Sen måste du ha stor nog grafikdel för att motivera det, och det har du inte i Kaveri. Sen begränsar du dig såklart termiskt.

Permalänk
Medlem
Skrivet av Pie-or-paj:

För hög TDP.
För gameing vill man ha ett diskret grafikkort och till kontorsarbete, film, surf, whatever så vill man ha lägre strömförbrukning.

Men köp inte toppprocessorn då, dom släpper ju processorer i serien med ~65watt och ~45watt också.

Skrivet av Pie-or-paj:

Är det bara jag som inte kan se den tilltänkta marknaden?

Redan Llano är väldigt kompetent för enklare gaming faktiskt och GPGPU-tillämpningar blir allt vanligare.
AMDs strategi har redan sedan Bulldozer började planeras vara mer och mer inriktad på GPGPU-tillämpningar och HUMA är nästa stora steg för det.

Det är extremt få saker som man gör när man inte spelar som faktiskt är cpu-begränsat idag som inte hade tjänat på att göras av grafikprocessorn istället, t.ex. multimediahantering som filmkromprimering osv.

Dessutom får man en ordentligt kompetent allround dator som klarar av att spelas på riktigt okej ändå till ett väldigt lågt pris och en väldigt liten formfaktor med AMDs A-serie utan diskret grafikkort.

Permalänk

Med Mantle kommer du att kunna Lira BF4 med denna cpu utan extern grafikkort
Kommer bli sjukt.

Visa signatur

2x Intel E5-2643V2 | 2x AMD 290x | 4x Samsung SSD EVO 500GB RAID 6 | 4xWD RED 4TB RAID6 | ASUS Z9PE-D8 WS | 3x Acer GD245HQ Limited Edition | Corsair 64GB (8x8GB) CL10 1866MHz VENGEANCE LP | FSP Aurum Pro 1200W | HRT HeadStreamer | Sennheiser HD 650 | Cherry MX 8000 | ZOWIE SPAWN (STOR SOM FAN)

Permalänk
Medlem
Skrivet av MrNeikter:

Självklart menade han VRAM vilket teoretiskt sett går utmärkt att köra istället för "vanligt" RAM. PS4:an gör till exempel det.

Nej det gör det inte. De är designade för olika användningsområden. Bara för att GDDR5 är baserade på DDR3 designen så går det inte utmärk att köra istället för "vanliga RAM.

http://www.techspot.com/community/topics/whats-the-difference...

Inlägg är ganska bra, från vad jag har läst tidigare.
"System memory (DDR3) benefits from low latency (tight timings) at the expense of bandwidth, GDDR5's case is the opposite. Timings for GDDR5 would seems unbelieveably slow in relation to DDR3, but the speed of VRAM is blazing fast in comparison with desktop RAM- this has resulted from the relative workloads that a CPU and GPU undertake. Latency isn't much of an issue with GPU's since their parallel nature allows them to move to other calculation when latency cycles cause a stall in the current workload/thread."

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem

Är det bara jag som funderar på om inte 7850k skulle fungera väl i en gamingorienterad budget laptop? CPU-delen drar säkert mer än man skulle vilja, men GPU skulle kompensera lite...

Permalänk
Medlem
Skrivet av HurMycket:

Jag vet; jag har själv en 2600K. Men 2700K är helt enkelt mer logiskt och det hade varit relativt enkelt för Svensson att förstå att 3700K är den upplåsta i7:an ur generation 3, medan 4500K är den upplåsta i5:an ur generation 4. 2500K–3500K–4500K eller 2500K–3570K–4670K, vilket är enklast? Allt hade varit så mycket enklare och man hade sluppit alla "3750K" och andra missförstånd bland folk – även här på SweClockers.

Nåja, nu handlar ju den här artikeln om AMD. Men de har fått utstå så mycket bashning i kommentarer till artiklar om Intel och Nvidia, så det kan vara bra för balansen.

För att ändå skriva någonting on topic: Jag förstår såklart att APU:er är awesome osv, men jag säger tyvärr mest "meh" åt AMD:s processorer nuförtiden. Jag är bara intresserad av något som kan tävla mot 4930K, eller åtminstone 4770K.

Ok, då förstår jag hur du menar. och ja, det hade nog varit smidigare.

Visa signatur

Akashiro 0.9: Ryzen 5 7600, Radeon RX 7800XT Pure: 64/2000
https://podcasters.spotify.com/pod/show/thomaseron

Permalänk
Medlem
Skrivet av dannesthlm:

Nu känns det väl lite som att det fortfarande är aktuellt med "diskret" grafikkort om man inte avser laptopmodeller eller den allra mest slimmade HTPC där ett grafikkort absolut inte får plats.

Det är väl lite som 3570K,3770K,4770K etc. ALLA har inbyggda grafikdelar, väldigt få bryr sig (förutom de med laptop där dessa faktiskt används). Det som är mest intressant är således rena CPU-prestanda och motsvarande jämförelse mot intelprolle i samma prisklass.

Det är inte bara platsen, utan att ha en krets med både CPU+GPU minskar behovet av kylning och ljudnivån.
Byggde nyss en nas/htpc med a10-5800k och den presterar väldigt bra till allmänt datorbruk (tänk mer beräkning, mindre gaming) med tanke på det minimala antalet komponenter och platsen.

Lär funka suveränt som kontorsdator och enklare hemdator för päronen och kidsen med, om de inte vill köra på laptop.

Tycker det är bra att AMD håller sig kvar i gamet.

Visa signatur

|[●▪▪●]| #Lekburk#: Ryzen 3700X >-< GB-X570-AE >-< 32GB DDR4 >-< MSI RTX 3070 >-< 970 EVO 1TB SSD>--
--< Arctic Freezer 34 >-< FD Define R4 >-< Seasonic F.+ 650W >-< Acer XF270HUA >-< AOC Q2778VQE >--
#Servering#: Ryzen 1700@3,6GHz >-< Prime X470 Pro >-< 16GB DDR4 >-< GTX 1030 >-< 970 EVO 500GB SSD >--
--< Stockkylare >-< Antec P182 >-< Silver Power 600W >-< Samsung 245T |[●▪▪●]|

Permalänk
Medlem
Skrivet av RHWarrior:

Det är inte bara platsen, utan att ha en krets med både CPU+GPU minskar behovet av kylning och ljudnivån.
Byggde nyss en nas/htpc med a10-5800k och den presterar väldigt bra till allmänt datorbruk (tänk mer beräkning, mindre gaming) med tanke på det minimala antalet komponenter och platsen.

Lär funka suveränt som kontorsdator och enklare hemdator för päronen och kidsen med, om de inte vill köra på laptop.

Tycker det är bra att AMD håller sig kvar i gamet.

Själv är jag gammal AMD'are också så där är vi lika. Inte så att jag aldrig köper andra märken dock om de är mer prisvärda, men konkurrens är bra.

Har själv en 5800K som jag körde med intern grafikdel först. Det innebar att jag fick lägga en massa extrapengar på snabbare minnen till att börja med. Sedan hade vi värmeutvecklingen ja... Självfallet blir det inte mindre utan MER värme som ska ut ur samma processorkylare, vilket ledde till hög ljudnivå från kylningen samt förhållandevis höga temperaturer.

Ja, sen köpte jag ett diskret grafikkort till, värmen går ner så att den totala ljudnivån blir lägre i mitt fall, trots grafikkortsfläkten. Bättre prestanda, naturligtvis dessutom. Det ende som är tråkigt är de onödiga pengarna på 2400MHz minnen jag betalade. Lyckades inte ens köra dom i mer än 2133 förresten.

Bättre CPU-kylaren än det jag använde kan man ju alltid göra, men sitter man med lite mindre datorlåda kanske man heller inte har plats eller vill ha en jätteklump. Så min personliga erfarenhet är att alltid köra diskret grafikkort om man har plats.

Permalänk
Medlem
Skrivet av dannesthlm:

...
Har själv en 5800K som jag körde med intern grafikdel först. Det innebar att jag fick lägga en massa extrapengar på snabbare minnen till att börja med. Sedan hade vi värmeutvecklingen ja... Självfallet blir det inte mindre utan MER värme som ska ut ur samma processorkylare, vilket ledde till hög ljudnivå från kylningen samt förhållandevis höga temperaturer.

Ja, sen köpte jag ett diskret grafikkort till, värmen går ner så att den totala ljudnivån blir lägre i mitt fall, trots grafikkortsfläkten. Bättre prestanda, naturligtvis dessutom. Det ende som är tråkigt är de onödiga pengarna på 2400MHz minnen jag betalade. Lyckades inte ens köra dom i mer än 2133 förresten.

Jo det är en kompromiss, lådan jag har pallar inte fullhöjdskort utan moddning men dator är heller inte tänkt som ersättare till ett desktopsystem.
Kör med 1866MHz minnen, CPUn är nerklockad till 3.5GHz för at hålla tempsen på rimlig nivå med marginal (60-65 grader vid full load efter nån timma), dock är eftermarknadskylaren såpass tyst att det som låter mest är när min gamla 1TB-disk går upp i varv. Tror inte mobot stödjer undervoltning som säkert hade kunnat trimma på temperaturer ytterligare, det har hjälpt på andra CPUer jag labbat med.

Tänker mig att top/middle end AMD CPU borde vara mer lättkyld i en minitower eller miditower dock, som allt annat.

Edit: Återstår att labba med CoolnQuiet, target temp och sånt, kanske kan trimma lite till där, den är rätt mjäkigt satt just nu.

Visa signatur

|[●▪▪●]| #Lekburk#: Ryzen 3700X >-< GB-X570-AE >-< 32GB DDR4 >-< MSI RTX 3070 >-< 970 EVO 1TB SSD>--
--< Arctic Freezer 34 >-< FD Define R4 >-< Seasonic F.+ 650W >-< Acer XF270HUA >-< AOC Q2778VQE >--
#Servering#: Ryzen 1700@3,6GHz >-< Prime X470 Pro >-< 16GB DDR4 >-< GTX 1030 >-< 970 EVO 500GB SSD >--
--< Stockkylare >-< Antec P182 >-< Silver Power 600W >-< Samsung 245T |[●▪▪●]|

Permalänk
Medlem
Skrivet av RHWarrior:

Jo det är en kompromiss, lådan jag har pallar inte fullhöjdskort utan moddning men dator är heller inte tänkt som ersättare till ett desktopsystem.
Kör med 1866MHz minnen, CPUn är nerklockad till 3.5GHz för at hålla tempsen på rimlig nivå med marginal (60-65 grader vid full load efter nån timma), dock är eftermarknadskylaren såpass tyst att det som låter mest är när min gamla 1TB-disk går upp i varv. Tror inte mobot stödjer undervoltning som säkert hade kunnat trimma på temperaturer ytterligare, det har hjälpt på andra CPUer jag labbat med.

Tänker mig att top/middle end AMD CPU borde vara mer lättkyld i en minitower eller miditower dock, som allt annat.

Edit: Återstår att labba med CoolnQuiet, target temp och sånt, kanske kan trimma lite till där, den är rätt mjäkigt satt just nu.

Tips från mig (om du inte har gjort det redan). På mitt moderkort (Asrock) var av någon anledning Vcore väldigt högt satt, jag sänkte en massa (en bit under deras rekommenderade värde till och med). Fungerade (även med standardklock) och sänkte temperaturerna med åtminstone 10 grader vad jag kommer ihåg.

Permalänk
Medlem
Skrivet av dannesthlm:

Tips från mig (om du inte har gjort det redan). På mitt moderkort (Asrock) var av någon anledning Vcore väldigt högt satt, jag sänkte en massa (en bit under deras rekommenderade värde till och med). Fungerade (även med standardklock) och sänkte temperaturerna med åtminstone 10 grader vad jag kommer ihåg.

Det är det som är grejen, finns ingen Vcore-inställning på det mobot.
Men det är lugna puckar så länge jag har 15-20 graders marginal mot vad kretsen klarar.

Visa signatur

|[●▪▪●]| #Lekburk#: Ryzen 3700X >-< GB-X570-AE >-< 32GB DDR4 >-< MSI RTX 3070 >-< 970 EVO 1TB SSD>--
--< Arctic Freezer 34 >-< FD Define R4 >-< Seasonic F.+ 650W >-< Acer XF270HUA >-< AOC Q2778VQE >--
#Servering#: Ryzen 1700@3,6GHz >-< Prime X470 Pro >-< 16GB DDR4 >-< GTX 1030 >-< 970 EVO 500GB SSD >--
--< Stockkylare >-< Antec P182 >-< Silver Power 600W >-< Samsung 245T |[●▪▪●]|

Permalänk
Quizmaster Malmö 22

Så var förväntas dessa ligga i prestanda jämfört mot i5 2600K, 3570K och 4670K ?

Visa signatur

[Gigabyte EP35-DS4][Intel Core 2 Duo E8400 3.0 Ghz][2x2GB Corsair XMS 2][Gainward GTX 570][Sandisk Extreme II 480GB][Corsair HX 620W][Fractal Design Define XL R4][Acer GD245HQBID]

Permalänk
Hedersmedlem
Skrivet av Campaigner:

Så var förväntas dessa ligga i prestanda jämfört mot i5 2600K, 3570K och 4670K ?

20% bättre processorprestanda än richland (som i sin tur påstods vara 20%-40% snabbare än trinity) talas det väl om.

Permalänk
Datavetare
Skrivet av Petterk:

virtual void

5500MHz GDDR5 bör nog ha en CL på 18. Nu vet vi väl att X1 kör sina minnen i 2133, men det betyder att när den så gör så har den använt CL14. Båda bör ligga runt 13 ns. Ska de under 11ns måste de ligga långt över både minnestillverkarens specifikationer och JEDEC. Det är mycket mer som skiljer däremot. Det som ger mer bandbredd är också hur och vad som får tillgång till banbredden av minneskontrollern, både PS4 och X1 så är det vitt skilda saker att från CPU till minne och GPU till minne, och olika snabbt. GDDR5 ger möjlighet för PS4an att ha dubbla bandbredden. Processorn ser det bara som en 20GiB/s buss däremot medan grafiken kan använda all bandbredd. Det fungerar inte så på enklare integrerade grafikkretsar. Allt minne där är processorns, dito extern L4 hos Intel. Det är ju dessutom grafikkretsarna de vill ska fungera som kraftigare kort med eget minne, att då försöka lösa bandbredden med några MB eSRAM är inte samma sak. Men är säkert en bra lösning om de också lägger ner tid på det, och anpassar mjukvaran därefter.

Dold text

Som jag sa har jag dålig koll på GDDR5, hittade flera referenser via Google där folk hävdade CAS på ner till 15 och DDR2133 finns definitivt med CL9 även om det är vanligare med CL11. Nu visar det sig att tittar man här (sida43) så är lägsta möjliga CL 16 och högsta 20. Så PS4 har en CL mellan 16 och 20 (på en 1350MHz "command freq") medan XBO har en CL mellan 9 och 11 (på en 1066Mhz "command freq").

Poängen är att även om vi antar att PS4 har CL20 och XBO CL9 så kommer den genomsnittliga latensen ändå skilja väldigt lite då den bara spelar roll för minnessaccesser som helt missar cache och där prefetchern inte alls lyckats gissa nästa access.

Så i detta fall
PS4: latens ~15ns
XBO: ~8ns (CL 11 kanske är sannolikare och då är den ~10n, men låt oss använda 8ns i beräkningsexemplet)

Men dessa siffror är alltså bara om man missar cache och ändå lyckas accessa en minnescell i samma kolumn, rätt osannolikt. Hittade denna

Dold text

som visar siffror som i alla fall jag känner igen från verkligheten. Gör man en helt slumpmässig läsning någonstans som inte ligger i cache så har prefetchern ingen chans och man hamnar på en latens på 60-120ns (en siffra som varit nära nog konstant i 20år, så RAM får bättre bandbredd men inte bättre latens).

Kort och gott: ja PS4 har sämre latens mot RAM men genomsnittlig latens kommer skilja väldigt lite då ett spel lär har en cache-hit-rate på minst 90% så det är bara på de övriga <10% där latensen överhuvudtaget spelar någon roll.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av GuessWho:

Jag vet inte hur relevant jämförelsen är...
Men om man tittar på hårddiskar, så har man både access tid och överföringshastighet där också.
I fallet med hårddiskar så är det vanligtvis ganska stor skillnad i hur stor throughput man får om det är många små filer som ska hittas och sen läsas eller skrivas, jämfört med om det är få större filer där man har större del sekventiell läsning/skrivning.

Finns det någon form av motsvarighet till sekventiell läsning/skrivning på ram?
Att om det är en större mängd sammanhängande data så går det snabbare än om det är mycket små 'filer' överallt ?

Jag tänkte då att latenserna kan spela mer eller mindre roll beroende på hur minnet ska användas?
Att för vissa användningsområden kan latenserna ha större betydelse och andra mindre?
I så fall kanske lite sämre latenser inte alltid innebär bedrövlig prestanda rent praktiskt ?

Visst är det stor skillnad på sekventiell och helt slumpmässig läsning. Läser du sekventiellt så blir verkligen CAS den enda begränsade faktorn då du kommer gå igenom var enda kolumn (CAS beskriver tiden att ändra kolumn) i den nu öppna raden innan du går till nästa rad.

Sekventiellt läsning mot RAM betyder också att en CPU som Jaguar kommer kunna "gissa" din nästa läsning och den kommer därför "prefetcha" in i CPU-cachen hela tiden. Ett sådan accessmönster är i princip det enda fallet där bandbred mot RAM är relevant, alla slumpmässiga läsningar/skrivningar kommer vara så begränsade av latens att de inte kommer nära bandbreddsgränsen oavsett bandbredd.

Medan en helt slumpmässig läsning som missar cache kan ta >100ns så kan en sekventiell läsning som ändå råkar missa cache ta 20-30ns därför att CPUn hade redan "gissat" att denna läsning skulle ske och inlett minnestransaktionen en stund innan den faktiskt behövdes.

För en modern CPU betyder minneslatens egentligen allt, men då latensen mot RAM varit mer eller konstant under de senaste 20 åren så har man varit tvungen att utveckla extremt avancerade CPU-cachar som "gömmer" latensen. Så i praktiken betyder latens mot RAM väldigt lite, något det finns massor med tester på Internet som visar. Det viktiga är att ha en riktigt bra CPU-cache.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Som jag sa har jag dålig koll på GDDR5, hittade flera referenser via Google där folk hävdade CAS på ner till 15 och DDR2133 finns definitivt med CL9 även om det är vanligare med CL11. Nu visar det sig att tittar man här (sida43) så är lägsta möjliga CL 16 och högsta 20. Så PS4 har en CL mellan 16 och 20 (på en 1350MHz "command freq") medan XBO har en CL mellan 9 och 11 (på en 1066Mhz "command freq").

Poängen är att även om vi antar att PS4 har CL20 och XBO CL9 så kommer den genomsnittliga latensen ändå skilja väldigt lite då den bara spelar roll för minnessaccesser som helt missar cache och där prefetchern inte alls lyckats gissa nästa access.

Så i detta fall
PS4: latens ~15ns
XBO: ~8ns (CL 11 kanske är sannolikare och då är den ~10n, men låt oss använda 8ns i beräkningsexemplet)

Men dessa siffror är alltså bara om man missar cache och ändå lyckas accessa en minnescell i samma kolumn, rätt osannolikt. Hittade denna

som visar siffror som i alla fall jag känner igen från verkligheten. Gör man en helt slumpmässig läsning någonstans som inte ligger i cache så har prefetchern ingen chans och man hamnar på en latens på 60-120ns (en siffra som varit nära nog konstant i 20år, så RAM får bättre bandbredd men inte bättre latens).

Kort och gott: ja PS4 har sämre latens mot RAM men genomsnittlig latens kommer skilja väldigt lite då ett spel lär har en cache-hit-rate på minst 90% så det är bara på de övriga <10% där latensen överhuvudtaget spelar någon roll.

Så nu ska GDDR5 få högre latenser/timings än standard och DDR3 lägre? Det mesta minnet är menat att användas åt GPUn och ja, det är mycket data som ska skyfflas. Det mesta är alltså utanför cache coherency-bussarna. Ren CPU så har du inte mer än 10-30GiB/s beroende på konsol. Latenserna finns i minneskontrollern och är beroende på vilken "buss" man läser via.

Stoppar du in ett XMP-minne i en stationär dator så kör den inte i CL9, det är överklockade inställningar du kommer åt genom att manuellt slå på XMP i firmware. Vi kan kort och gott anta att system aldrig kör med detta standard. Vi vet modellbetäckningen på minnen som sitter i X1, de är specificerade för CL14. För PS4an är det lite svårare då minnestillverkarna inte har några matriser där de avkodar sån information vad jag har hittat, dock hittat äldre dokument där den hastigheten kör CL16/18, precis som du länkar till. Men det är annat som skiljer som sagt. Inklusive hur det är uppdelat mellan ren cpu, Onion, Onion+ och Garlic-bussarna mot minnet.

Under CL13 är osannolikt att köra utan att köra överklockat utanför specifikationerna, och jag tvivlar på att de binnar för det när det köper samma modellnummer som andra, och att testa på moderkorten är uteslutet. Så du kommer inte under 11 ns där. Men CAS är bara en del av det hela. X1:ans SRAM är till största delen enbart för GPUn också, så det fungerar inte som en stor L3. Valet med SRAM betyder att de valt bort ett antal CUs från GPUn.

Permalänk
Medlem
Skrivet av Elgot:

20% bättre processorprestanda än richland (som i sin tur påstods vara 20%-40% snabbare än trinity) talas det väl om.

Fast det där är ett felaktigt sätt att beskriva prestandan på. Du får det att låta som att Kaveri kommer ge sämre prestandaboost än Richland, du får det också att se ut som att AMD överdrev om prestandan i Richland. Faktum är att de där 20-40% var i grafikprestanda på låga TDP:er på grund av förbättrad turbo funktion, med obefintlig prestandavinst från IPC. Det kan inte jämföras med upp till 20% bättre CPU-prestanda från bättre IPC.

Permalänk
Datavetare
Skrivet av Petterk:

Så nu ska GDDR5 få högre latenser/timings än standard och DDR3 lägre? Det mesta minnet är menat att användas åt GPUn och ja, det är mycket data som ska skyfflas. Det mesta är alltså utanför cache coherency-bussarna. Ren CPU så har du inte mer än 10-30GiB/s beroende på konsol. Latenserna finns i minneskontrollern och är beroende på vilken "buss" man läser via.

Stoppar du in ett XMP-minne i en stationär dator så kör den inte i CL9, det är överklockade inställningar du kommer åt genom att manuellt slå på XMP i firmware. Vi kan kort och gott anta att system aldrig kör med detta standard. Vi vet modellbetäckningen på minnen som sitter i X1, de är specificerade för CL14. För PS4an är det lite svårare då minnestillverkarna inte har några matriser där de avkodar sån information vad jag har hittat, dock hittat äldre dokument där den hastigheten kör CL16/18, precis som du länkar till. Men det är annat som skiljer som sagt. Inklusive hur det är uppdelat mellan ren cpu, Onion, Onion+ och Garlic-bussarna mot minnet.

Under CL13 är osannolikt att köra utan att köra överklockat utanför specifikationerna, och jag tvivlar på att de binnar för det när det köper samma modellnummer som andra, och att testa på moderkorten är uteslutet. Så du kommer inte under 11 ns där. Men CAS är bara en del av det hela. X1:ans SRAM är till största delen enbart för GPUn också, så det fungerar inte som en stor L3. Valet med SRAM betyder att de valt bort ett antal CUs från GPUn.

Möjligt att CL är högre än 11 på XBO, poängen är ändå att det spelar ingen större roll då majoritet av alla minnesaccesser kommer träffa CPU-cachen. Skulle de inge göra det kommer man ha större problem än några % bättre RAM latens hit eller dit.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Möjligt att CL är högre än 11 på XBO, poängen är ändå att det spelar ingen större roll då majoritet av alla minnesaccesser kommer träffa CPU-cachen. Skulle de inge göra det kommer man ha större problem än några % bättre RAM latens hit eller dit.

GDDR5 för cpu, i ett system med diskret grafik skulle hur som helst inte kunna använda konsolernas arkitektur. Dual-channel DDR3 skulle resultera i högre bandbredd än konsolerna har. Och givetvis mätbart bättre/lägre latenser vid överklockning än båda konsolerna. Det är byggt för helt andra saker. Mesta av minnet kommer gpun arbete mot, utan att gå via cpuns cache som hos vanliga datorsystem eller en Intel Haswell. Så det är helt andra mål och arkitektur där än vad som är aktuellt i arbetsstationer eller desktops för spel.

Permalänk
Datavetare
Skrivet av Petterk:

GDDR5 för cpu, i ett system med diskret grafik skulle hur som helst inte kunna använda konsolernas arkitektur. Dual-channel DDR3 skulle resultera i högre bandbredd än konsolerna har. Och givetvis mätbart bättre/lägre latenser vid överklockning än båda konsolerna. Det är byggt för helt andra saker. Mesta av minnet kommer gpun arbete mot, utan att gå via cpuns cache som hos vanliga datorsystem eller en Intel Haswell. Så det är helt andra mål och arkitektur där än vad som är aktuellt i arbetsstationer eller desktops för spel.

Har aldrig nämnt GPUn, den är ju extremt okänslig för latens så finns ingen anledning för den att använda CPU-cachen när det finns GDDR5 RAM. I fallet "Iris Pro" så är det bandbredden man vill åt i 128MB eDRAM, inte latensen samma sak gäller XBO. Men där kör man ju även mot DDR3 inte GDDR5.

Så för CPUn är hög latens dåligt, men i praktiken spelar latensen mot RAM väldigt liten roll just p.g.a. CPU-cachen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Entusiast
Skrivet av Yoshman:

Har aldrig nämnt GPUn, den är ju extremt okänslig för latens så finns ingen anledning för den att använda CPU-cachen när det finns GDDR5 RAM. I fallet "Iris Pro" så är det bandbredden man vill åt i 128MB eDRAM, inte latensen samma sak gäller XBO. Men där kör man ju även mot DDR3 inte GDDR5.

Så för CPUn är hög latens dåligt, men i praktiken spelar latensen mot RAM väldigt liten roll just p.g.a. CPU-cachen.

Fast det där grafikminnet/L4-cachen i Iris Pro råkar ha lägre latencer än DDR3 också. Finns det några arbetslaster som man realistiskt kan se på en hemdator som missar cache så mycket att man skulle se en prestandavinst med 128 MB L4 gentemot bara L3 och RAM som är standard på Intels andra processorer?

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Yoshman:

Har aldrig nämnt GPUn, den är ju extremt okänslig för latens så finns ingen anledning för den att använda CPU-cachen när det finns GDDR5 RAM. I fallet "Iris Pro" så är det bandbredden man vill åt i 128MB eDRAM, inte latensen samma sak gäller XBO. Men där kör man ju även mot DDR3 inte GDDR5.

Så för CPUn är hög latens dåligt, men i praktiken spelar latensen mot RAM väldigt liten roll just p.g.a. CPU-cachen.

I Iris Pro har du inget "grafikminne" alls. Allt går via processorn. Det är framförallt latenserna som L4an minskar och det som går ut till ram drar varken nytta av bandbredden eller latenserna. Hos X1 så gör valet av DDR3 och SRAM att de både får lägre praktisk bandbredd och prestanda, och mindre beräkningskraft med färre compute units, men vissa funktioner kan givetvis dra nytta av det inbyggda minnet precis som hos X360. Valet av GDDR5 görs givetvis pga att grafikprocessorn behöver bandbredden och det erbjuder dubbla bandbredden per krets, eller per bit. Eftersom det inte är aktuellt att använda sig 256-bit eller 512-bit GDDR5 för processorn så ja, det finns inget val att göra, oberoende på hur latenser och design av minneskontroller ser ut då det inte är aktuellt med så stark gpu på klientdatorer ännu. Även Kaveri har bara straxt över 700 GFLOPS. Det är ju grafikdelen som styr och du får inte särskilt mycket bandbredd över till cpu i PS4 eller Xbox One eftersom det är ganska hårt uppdelat. Du har på en vanlig dator både mycket lägre latenser och högre bandbredd till cpun (från/till minnet) än hos båda konsolerna. Valet hos konsolerna har inte varit att ge hela systemet kraften. Processorn får givetvis lida när de integrerat och optimerat det för något helt annat. Oavsett minnestyp så är det inte vad som behövs i datorer med diskret gpu eller klen integrerad. Det är inte som du får plats med texturer och annat i cache.

Permalänk
Medlem

Jag vet att snabbare minnen gynnar GPU:n men hur är det att köra singel (en RAM-sticka alltså) istället för dual-channel på sina minnen? Kommer det påverka grafikprestandan?

Permalänk
Hjälpsam
Skrivet av Pellepelikan:

Jag vet att snabbare minnen gynnar GPU:n men hur är det att köra singel (en RAM-sticka alltså) istället för dual-channel på sina minnen? Kommer det påverka grafikprestandan?

Ja riktigt mycket, man bör undvika enkelsticka.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Hjälpsam

Angående prestandan, den bör räcka ganska bra för den som spelar på TV:n, där är ju upplösningen ganska låg.
Så som kombinerad HTPC och TV-speldator bör detta fungera kalasfint.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |