AMD lanserar Firepro-APU baserad på Trinity

Permalänk
Datavetare
Skrivet av Aleshi:

Trångt? Det är hastigheten som delas, och där är det inga problem. Jag ser det så här, spel kräver snabbt minne, både för CPU och GPU. CAD må kräva mycket minne, men hastigheten är inte lika viktigt, varken på CPU eller GPU.
Så om du har 2 grafikkort som presterar lika i spel, det ena med delad minnesbuss och det andra med en dedikerad minnesbuss, så är det med delad minnesbuss redan lite mer strypt än vad det vore i CAD. Därför borde det stå sig bättre i CAD när ren beräkningsprestanda är viktigare än bandbredd.
Med tanke på hur pass bra AMDs interna grafik står sig i spel, så borde det vara ännu bättre i CAD och dylikt där bandbredden är mindre viktig än i spel.

Alltså, självklart är bandbredd bra att ha och en begränsande faktor, men GPUn kommer inte vara mer begränsad än vad det är i spel. CAD kräver främst minnesmängd inte bandbredd.

Söker man lite kring AutoCAD så verkar det inte stämma att programmet inte kräver massor av CPUn. Såg också att folk klagade på att AutoCAD var väldigt dålig på att utnyttja många CPU-kärnor. Så det man vill ha om man jobbar med det programmet verkar vara maximal single-thread prestanda.

Och din slutsats du just drog om att AMD prestanda på spel går att översätta i bra prestanda på CAD är ju precis tvärs emot vad du tidigare hävdade (och föredömligt pekade på referens till benchmarks) där konsument varianterna av grafikkorten står sig väldigt dåligt mot Quadro/FirePro varianterna, trots likvärdig eller till och med högre rå prestanda i konsumentvarianterna. Så sanningen är att prestanda i spel säger väldigt lite om vad man kan förvänta sig i CAD-program.

Sanningen här är att vi ser effekterna av ren marknadssegmentering. Konsument-varianten av korten skulle utan problem kunna vara lika snabba som "pro" varianterna om drivarna var optimerade på samma sätt. Om du jobbat med OpenGL så vet du att när man specificerar geometrin så talar man även om hur man vill göra sin rendering. Spel använder sig uteslutande av polygoner (GL_POLYGON) med texturer på, medan CAD-program väldigt ofta använder sig av endast punkter (GL_POINTS), linjer (GL_LINES, GL_LINES_xxx) och andra saker utan texturer. Konsumentvarianterna av korten är extremt långsamma på att hantera GL_POINTS/GL_LINES, inte för att HW inte stödjer det, utan därför att ingen skulle köpa ett grafikkort för 5k-20k om det gick lika snabbt (eller snabbare) med kort för 1k-5k.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Har för mig folk testat flasha om konsumentgrafikkort med firmware för proffskort med samma hårdvara (med varierande framgång) och i de fall det lyckats så har det gjort stor skillnad. Så det är väl kombinationen firmware och drivrutin som gör skillnaden, men det kanske bara är hur kortet identifierar sig för drivrutinen som är skillnaden och att vissa saker stängs av i drivrutinen om det är ett konsumetkort som identifierats? Eller så kanske firmware i korten initierar olika optimeringsfunktioner? Alltså om man nu har ett proffskort, blir det då plötsligt dåligt på spel eftersom det optimerat sig själv annorlunda?

Kanske är en av anledningarna att grafikkortsjättarna ogärna släpper öppna drivrutiner för Linux? Konsumentkorten skulle plötsligt bli proffskort bara genom att kompilera om någon parameter?

Bara nyfiken.

Permalänk
Medlem
Skrivet av Yoshman:

Söker man lite kring AutoCAD så verkar det inte stämma att programmet inte kräver massor av CPUn. Såg också att folk klagade på att AutoCAD var väldigt dålig på att utnyttja många CPU-kärnor. Så det man vill ha om man jobbar med det programmet verkar vara maximal single-thread prestanda.

Jag pratar inte CPU-prestanda. Jag pratar om minnesbandbredd, lite otydligt kanske när jag använder ord som CPU och GPU, men det är bandbredden till dessa som det diskuterades om.

Skrivet av Yoshman:

Och din slutsats du just drog om att AMD prestanda på spel går att översätta i bra prestanda på CAD är ju precis tvärs emot vad du tidigare hävdade (och föredömligt pekade på referens till benchmarks) där konsument varianterna av grafikkorten står sig väldigt dåligt mot Quadro/FirePro varianterna, trots likvärdig eller till och med högre rå prestanda i konsumentvarianterna. Så sanningen är att prestanda i spel säger väldigt lite om vad man kan förvänta sig i CAD-program.

Men vad är detta? Nu vränger du ju bara saker på ett ruskigt oärligt sätt. Jag har inte sagt att man ska jämföra ett spelkort mot ett CAD-kort på detta viset. Självklart ska båda korten i den hypotetiska jämförelsen antingen vara spelvarianter eller CAD-varianter, alternativt flashas om samtidigt när man byter belastning.
Det jag säger är att om bandbredden till Trinity duger så pass bra till spel att den kan hävda sig bra mot motsvarande diskreta kort, så kan inte bandbredden vara ett argument till varför en CAD-variant av Trinity inte skulle stå sig minst lika bra mot motsvarande diskreta kort i CAD-version på CAD-belastningar.

Alltså, spel har högre krav på bandbredd, om en kärnas bandbredd duger till det så duger det till CAD.

Skrivet av Yoshman:

Sanningen här är att vi ser effekterna av ren marknadssegmentering. Konsument-varianten av korten skulle utan problem kunna vara lika snabba som "pro" varianterna om drivarna var optimerade på samma sätt. Om du jobbat med OpenGL så vet du att när man specificerar geometrin så talar man även om hur man vill göra sin rendering. Spel använder sig uteslutande av polygoner (GL_POLYGON) med texturer på, medan CAD-program väldigt ofta använder sig av endast punkter (GL_POINTS), linjer (GL_LINES, GL_LINES_xxx) och andra saker utan texturer. Konsumentvarianterna av korten är extremt långsamma på att hantera GL_POINTS/GL_LINES, inte för att HW inte stödjer det, utan därför att ingen skulle köpa ett grafikkort för 5k-20k om det gick lika snabbt (eller snabbare) med kort för 1k-5k.

Jag vet det där. Men är det relevant ens? Spelar ingen roll om det är drivrutiner eller magiska runor som är skillnaden mellan konsumentkort och proffskort, de presterar olika på olika saker och de kan anpassa priser därefter, eftersom det är mycket svårt att konvertera korten för slutkund.

Permalänk
Medlem
Skrivet av ronnylov:

Har för mig folk testat flasha om konsumentgrafikkort med firmware för proffskort med samma hårdvara (med varierande framgång) och i de fall det lyckats så har det gjort stor skillnad. Så det är väl kombinationen firmware och drivrutin som gör skillnaden, men det kanske bara är hur kortet identifierar sig för drivrutinen som är skillnaden och att vissa saker stängs av i drivrutinen om det är ett konsumetkort som identifierats? Eller så kanske firmware i korten initierar olika optimeringsfunktioner? Alltså om man nu har ett proffskort, blir det då plötsligt dåligt på spel eftersom det optimerat sig själv annorlunda?

Kanske är en av anledningarna att grafikkortsjättarna ogärna släpper öppna drivrutiner för Linux? Konsumentkorten skulle plötsligt bli proffskort bara genom att kompilera om någon parameter?

Bara nyfiken.

Jo men så är det ju, jag minns för länge sedan då många flashade om Geforce till Quadro, var väl säkert Geforce DDR och Geforce 2 tiden. Numera när flashning av moderkort blivit enklare så har de ansträngt sig mer med att spärra, så nu går det inte så lätt längre.

Permalänk
Datavetare
Skrivet av Aleshi:

Det jag säger är att om bandbredden till Trinity duger så pass bra till spel att den kan hävda sig bra mot motsvarande diskreta kort, så kan inte bandbredden vara ett argument till varför en CAD-variant av Trinity inte skulle stå sig minst lika bra mot motsvarande diskreta kort i CAD-version på CAD-belastningar.

Förklara då varför nVidia trycker väldigt hårt på att deras Quadro 4000/6000 modeller har väldigt hög bandbredd mot RAM just för att klara av komplexa modeller (OpenGL) och stora data-set (OpenCL). Quadro 6000 har en bandbredd på 144GB/s, rätt mycket högre än vad Trinity har..

AMD gör också en väldigt stor grej av att deras FirePro har än högre bandbredd, upp till hela 264GB/s. Varför lägger dessa två så mycket resurser på att skapa pro-kort med brutal minnesbandbredd om det är helt onödigt?

Spel må ha texturer och liknande, något som kräver väldigt mycket bandbredd. Men i program som AutoCAD och liknande så hanteras modeller med långt mycket fler vertex:es jämfört med spel, så kravet på bandbredd blir väldigt högt p.g.a. av det. Även i CAD program vill man använda texturer i vissa lägen, skillnaden mot spel är att man nog inte lägger på så mycket vertex/pixelshader effekter, med sådana effekter kräver ingen bandbredd då de sker på GPUn.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd
Skrivet av Yoshman:

AMD gör också en väldigt stor grej av att deras FirePro har än högre bandbredd, upp till hela 264GB/s. Varför lägger dessa två så mycket resurser på att skapa pro-kort med brutal minnesbandbredd om det är helt onödigt?

Gärmfört med DDR3 som oklockat har runt 16GB/s som då dessutom ska delas med CPUn. Blir en hel del i skillnad.

Permalänk
Medlem
Skrivet av Yoshman:

Förklara då varför nVidia trycker väldigt hårt på att deras Quadro 4000/6000 modeller har väldigt hög bandbredd mot RAM just för att klara av komplexa modeller (OpenGL) och stora data-set (OpenCL). Quadro 6000 har en bandbredd på 144GB/s, rätt mycket högre än vad Trinity har..

AMD gör också en väldigt stor grej av att deras FirePro har än högre bandbredd, upp till hela 264GB/s. Varför lägger dessa två så mycket resurser på att skapa pro-kort med brutal minnesbandbredd om det är helt onödigt?

Spel må ha texturer och liknande, något som kräver väldigt mycket bandbredd. Men i program som AutoCAD och liknande så hanteras modeller med långt mycket fler vertex:es jämfört med spel, så kravet på bandbredd blir väldigt högt p.g.a. av det. Även i CAD program vill man använda texturer i vissa lägen, skillnaden mot spel är att man nog inte lägger på så mycket vertex/pixelshader effekter, med sådana effekter kräver ingen bandbredd då de sker på GPUn.

Jag har då aldrig sett att de basunerar ut just minnesbandbredd som något speciellt. Tvärtom så har de ofta lägre minnesbandbredd på CAD-korten än motsvarande konsumentkort, vilket stödjer min tes. Faktum är att det är standard att CAD-korten har mer fokus på GPUn men lägre bandbredd, förklara gärna det! Det de brukar prata om är Gflops, CUDA-kärnor, shaders och funktioner. Känns lite taget ur luften det där med att de skulle lägga fokus på det i marknadsföringen, självklart skryter de om saker de är bra/bättre på, men det är inte samma sak.

Kasta sedan ett öga på det här.

http://www.tomshardware.com/reviews/firepro-v3900-review-benc...

Sedan kan du förklara varför GT430 som är ungefär som GT440 inte får märkbart mindre prestanda trots mindre än halva bandbredden! Den lilla prestandaskillnaden som syns kan tillskrivas den lite lägre GPU-frekvensen, man kan tycka att så stor bandbreddsskillnad skulle göra märkbar skillnad eller?

Skrivet av Morkul:

Gärmfört med DDR3 som oklockat har runt 16GB/s som då dessutom ska delas med CPUn. Blir en hel del i skillnad.

Nej, gammalt sketet DDR2 har högre bandbredd än det där. Utöver att bandbredd spelar MINDRE roll för professionella kort, så klarar Trinity över 34Gb/s, bättre än en del konsumentkort därute.

Jag vill allt se belägg för att bandbredd skulle vara viktigare för professionella tillämpningar än vad det är för spel med sina högupplösta texturer. Och en bra förklaring varför tillverkarna sparar ner på bandbredd men ökar beräkningskraften på professionella kort. Jag har stöd för mitt påstående, nu är det eran tur.

Permalänk
Avstängd
Skrivet av Aleshi:

Nej, gammalt sketet DDR2 har högre bandbredd än det där. Utöver att bandbredd spelar MINDRE roll för professionella kort, så klarar Trinity över 34Gb/s, bättre än en del konsumentkort därute.

Jag vill allt se belägg för att bandbredd skulle vara viktigare för professionella tillämpningar än vad det är för spel med sina högupplösta texturer. Och en bra förklaring varför tillverkarna sparar ner på bandbredd men ökar beräkningskraften på professionella kort. Jag har stöd för mitt påstående, nu är det eran tur.

Kolla in bland annat detta http://www.anandtech.com/show/4503/sandy-bridge-memory-scalin... Och då kör de ändå överklockat.

Betänk att du kommer gå ifrån 256-bit buss till 64-bit buss.

Permalänk
Medlem
Skrivet av Morkul:

Kolla in bland annat detta http://www.anandtech.com/show/4503/sandy-bridge-memory-scalin... Och då kör de ändå överklockat.

Betänk att du kommer gå ifrån 256-bit buss till 64-bit buss.

Nej, Trinity har 128 bitars buss. Nu jämför du visst också praktiska med teoretiska siffror.
För det första så får du i så fall allt slänga upp praktiska minnesbenchmarks på ett grafikkort också, fixar du det?
Och för det andra, ser du hur minnet skalar rätt bra med processorfrekvens? Det är för att CPUn i sig inte kan dra nytta av bandbredden, det krävs snabbare CPU för att dra nytta av minnena helt enkelt. De är för snabba för processorn. På Trinity så har du givetvis samma begränsning om du kör samma test, eftersom CPU-delen är för långsam för att dra nytta av all bandbredd. Men grafikdelen är inte begränsad av kärnornas hastighet, så den lider inte av det problemet.

Permalänk
Avstängd
Skrivet av Aleshi:

Nej, Trinity har 128 bitars buss. Nu jämför du visst också praktiska med teoretiska siffror.
För det första så får du i så fall allt slänga upp praktiska minnesbenchmarks på ett grafikkort också, fixar du det?
Och för det andra, ser du hur minnet skalar rätt bra med processorfrekvens? Det är för att CPUn i sig inte kan dra nytta av bandbredden, det krävs snabbare CPU för att dra nytta av minnena helt enkelt. De är för snabba för processorn. På Trinity så har du givetvis samma begränsning om du kör samma test, eftersom CPU-delen är för långsam för att dra nytta av all bandbredd. Men grafikdelen är inte begränsad av kärnornas hastighet, så den lider inte av det problemet.

Kan du länka infon om 128-bit bussen. Skulle vara riktigt roligt att se hur de lyckas på 64-cpu med 64-bit minne att fungera med 128-bit buss. Observera att de kör dual channel gör inte bussen till 128-bit.

Kollar du sedan på de tester som gjorts te-x detta så kommer de i syntetiska tester inte ens kommer upp i det teoretiska max 16GB/sek. Då ska sägas att syntetiska tester tar ut absolut MAX av vad av bandbredden vilket extremt svårt att få ut i normal användning.

Permalänk
Medlem
Skrivet av Morkul:

Kan du länka infon om 128-bit bussen. Skulle vara riktigt roligt att se hur de lyckas på 64-cpu med 64-bit minne att fungera med 128-bit buss. Observera att de kör dual channel gör inte bussen till 128-bit.

Suck, du vet att grafikkort kör på 32 bitars minneschip va? Men att man kör dem parallellt? Hört talas om Dual Channel, du vet tekniken som effektivt dubblerar bandbredden? Du vet att AMD haft 128 bitars minneskontroller sedan Athlon 64 släpptes? Du vet att bussbredden inte har något att göra med beräkningsenheternas bredd va? Athlon K7 var 32bit med hade 64 bitars minneskontroller i nordbryggan.

Skrivet av Morkul:

Kollar du sedan på de tester som gjorts te-x detta så kommer de i syntetiska tester inte ens kommer upp i det teoretiska max 16GB/sek. Då ska sägas att syntetiska tester tar ut absolut MAX av vad av bandbredden vilket extremt svårt att få ut i normal användning.

Och läste du ens mitt förra inlägg? Du kommer med ett argument EFTER att jag förklarat varför det inte gäller? Minnespoängen skalar med hastigheten på CPU-kärnorna, vilket bevisades i förra länken. Det bevisar också att CPUn är en begränsande faktor, GPUns utnyttjande av minneskontrollern är oberoende av CPUns begränsningar, och GPUn kan därmed komma upp i högre bandbredd.
Samtidigt har vi bevis för att minnesbandbredd är nedprioriterat i professionella kort, samtidigt som vi har bevis för att en halvering av minnesbandbredden inte gjorde någon skillnad alls mellan GT430 och GT440.

Alltså, Trinitys begränsningar för konsumentgrafik är större än begränsningarna för proffsapplikationer. Och till konsumentgrafik så fungerar Trinity riktigt bra. Trinity ser alltså ut att fungera utmärkt till CAD.

Permalänk
Avstängd
Skrivet av Aleshi:

Hört talas om Dual Channel, du vet tekniken som effektivt dubblerar bandbredden?

Du vet om att man idag inte använder "ganged mode" när man kör dual channel?

Vilket fall, frågetäcken finns över prestandan och det ska bli kul att se hur den presterar när den väl kommer. Man att redan nu hojta om extrem prestanda tycker jag är lite tidigt.

Permalänk
Entusiast
Skrivet av Aleshi:

Jag har då aldrig sett att de basunerar ut just minnesbandbredd som något speciellt. Tvärtom så har de ofta lägre minnesbandbredd på CAD-korten än motsvarande konsumentkort, vilket stödjer min tes. Faktum är att det är standard att CAD-korten har mer fokus på GPUn men lägre bandbredd, förklara gärna det! Det de brukar prata om är Gflops, CUDA-kärnor, shaders och funktioner. Känns lite taget ur luften det där med att de skulle lägga fokus på det i marknadsföringen, självklart skryter de om saker de är bra/bättre på, men det är inte samma sak.

Kasta sedan ett öga på det här.

http://www.tomshardware.com/reviews/firepro-v3900-review-benc...

Sedan kan du förklara varför GT430 som är ungefär som GT440 inte får märkbart mindre prestanda trots mindre än halva bandbredden! Den lilla prestandaskillnaden som syns kan tillskrivas den lite lägre GPU-frekvensen, man kan tycka att så stor bandbreddsskillnad skulle göra märkbar skillnad eller?

Nej, gammalt sketet DDR2 har högre bandbredd än det där. Utöver att bandbredd spelar MINDRE roll för professionella kort, så klarar Trinity över 34Gb/s, bättre än en del konsumentkort därute.

Jag vill allt se belägg för att bandbredd skulle vara viktigare för professionella tillämpningar än vad det är för spel med sina högupplösta texturer. Och en bra förklaring varför tillverkarna sparar ner på bandbredd men ökar beräkningskraften på professionella kort. Jag har stöd för mitt påstående, nu är det eran tur.

Du försöker alltså dra slutsatser om minnesbandbredd baserat på ett kort med strypt prestanda? Det är ju fruktansvärt svårt att säga något vettigt när båda Geforece hålls tillbaka av diverse spärrar som vi inte riktigt vet hur de fungerar.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Morkul:

Du vet om att man idag inte använder "ganged mode" när man kör dual channel?

Vilket fall, frågetäcken finns över prestandan och det ska bli kul att se hur den presterar när den väl kommer. Man att redan nu hojta om extrem prestanda tycker jag är lite tidigt.

Du vet att det inte spelar roll ur ren bandbreddssynpunkt om det är ganged mode eller inte? 64+64 eller 128 ger samma bandbredd, det är inte som i singlechannel där det är 64bit oavsett hur många 64tbit minnen man sätter i.

Skrivet av Zotamedu:

Du försöker alltså dra slutsatser om minnesbandbredd baserat på ett kort med strypt prestanda? Det är ju fruktansvärt svårt att säga något vettigt när båda Geforece hålls tillbaka av diverse spärrar som vi inte riktigt vet hur de fungerar.

Nej, det jag menar är att allt jag kan och vart jag än vänder mig så pekar allt åt att minnesbandbredd är viktigare i spel än i CAD, jag har en rad belägg för detta. Du får gärna försöka hitta något som visar motsatssen.

Permalänk
Avstängd
Skrivet av Aleshi:

Du vet att det inte spelar roll ur ren bandbreddssynpunkt om det är ganged mode eller inte? 64+64 eller 128 ger samma bandbredd, det är inte som i singlechannel där det är 64bit oavsett hur många 64tbit minnen man sätter i.

Tar ett extremt förenklat exempel för jag orkar inte sitta och räkna med de extra cyklar det tar för att dela upp en variabel i flera delar, orkar inte heller räkna på latens eftersom det varierar kraftigt.

Om du har en tråd som ska läsa eller skriva ett 256 bitars stort värde ur en 256 bitars buss så kommer det att ta en cykel.

Om du har en tråd som ska läsa eller skriva ett 256 bitars värde till en dual 64 bitars buss så kommer det ta 4 cyklar plus eventuell minneslatens.

Om du har två trådar som ska läsa eller skriva ett 256 bitars värde (128 bitar per tråd) så kommer detta ta 2 cyklar plus eventuell minneslatens.

Ja den totala minnesbandbredden är 128 bitar men en tråd kan inte komma åt båda kanalerna under samma cykel.

Problemet som jag ser är att programmen helt enkelt inte är anpassade för att använda en så liten buss vilket gör att de KAN tappa en hel del prestanda. Skulle programmen vara anpassade för att hämta upp flera småvariabler så skulle problemet vara tämligen litet.

Permalänk
Medlem
Skrivet av Morkul:

Tar ett extremt förenklat exempel för jag orkar inte sitta och räkna med de extra cyklar det tar för att dela upp en variabel i flera delar, orkar inte heller räkna på latens eftersom det varierar kraftigt.

Om du har en tråd som ska läsa eller skriva ett 256 bitars stort värde ur en 256 bitars buss så kommer det att ta en cykel.

Om du har en tråd som ska läsa eller skriva ett 256 bitars värde till en dual 64 bitars buss så kommer det ta 4 cyklar plus eventuell minneslatens.

Om du har två trådar som ska läsa eller skriva ett 256 bitars värde (128 bitar per tråd) så kommer detta ta 2 cyklar plus eventuell minneslatens.

Ja den totala minnesbandbredden är 128 bitar men en tråd kan inte komma åt båda kanalerna under samma cykel.

Problemet som jag ser är att programmen helt enkelt inte är anpassade för att använda en så liten buss vilket gör att de KAN tappa en hel del prestanda. Skulle programmen vara anpassade för att hämta upp flera småvariabler så skulle problemet vara tämligen litet.

Ja men synd att Trinity har en enda 128-bitars kontroller då. Ditt argument faller alltså.
Och många billigare CAD-kort har smala bussar, och de verkar inte få oproportionerligt sämre prestanda än sina större syskon. Finns alltså fortfarande inget som pekar på att CAD skulle kräva mer bandbredd än spel.

Permalänk
Avstängd
Skrivet av Aleshi:

Ja men synd att Trinity har en enda 128-bitars kontroller då. Ditt argument faller alltså.
Och många billigare CAD-kort har smala bussar, och de verkar inte få oproportionerligt sämre prestanda än sina större syskon. Finns alltså fortfarande inget som pekar på att CAD skulle kräva mer bandbredd än spel.

Åter igen. Visa mig en källa på det. Jag har, som jag skrivit tidigare, letat som en galning på AMDs hemsida och där skriver de endast om 64-bit dual channel även när de pratar om Trinity.

Edit: Källa på att det är dual chanel (2*64 bit) http://www.amd.com/us/products/workstation/graphics/ati-firep...

Permalänk
Medlem
Skrivet av Morkul:

Åter igen. Visa mig en källa på det. Jag har, som jag skrivit tidigare, letat som en galning på AMDs hemsida och där skriver de endast om 64-bit dual channel även när de pratar om Trinity.

Edit: Källa på att det är dual chanel (2*64 bit) http://www.amd.com/us/products/workstation/graphics/ati-firep...

I din källa:
"Dual Channel DDR3 (128-bit)"
De hade 128bit sedan Athlon 64, med Phenom och Phenom II så kom möjligheten att köra det som 2x64bit, (unganged) för att öka flertrådssprestandan något. Jag har inte koll på hur det var med Llano, men med Trinity kör de alltså 128bit.

Permalänk
Avstängd
Skrivet av Aleshi:

I din källa:
"Dual Channel DDR3 (128-bit)"
De hade 128bit sedan Athlon 64, med Phenom och Phenom II så kom möjligheten att köra det som 2x64bit, (unganged) för att öka flertrådssprestandan något. Jag har inte koll på hur det var med Llano, men med Trinity kör de alltså 128bit.

Jag dual channel men det är som sagt 2*64 bit fortfarande.

Om man ska använda sig av ganged mode så måste OS vara anpassat för 128 bitars minnes adressering. Nu kan det vara så att det finns någon version av Windows server som är anpassad för det men vanliga Widnwos versioner är inte det. Eventuellt skulle det komma special versioner av Win 8 som skulle kunna adressera med 128-bit, har dock inte läst på så mycket om det eftersom det.

Problemet i dagsläget är att CPUn arbetar med 64 bitar så att få en 128 bitars buss ger inte så mycket till prestanda boost.

Man faktum kvarstår att ingen av oss här på forumet vet i dagsläget hur det strypta minnes bussen som dessutom ska delas med CPU påverkar prestandan. Finns i och för sig andra saker som kan strypa prestandan också med återigen så vet vi inte hur prestandan bli tills vi får se ordentliga tester. Jag säger inte på något vis att du har fel, bara lite undrande till hur du kan vara så pass säker på att det kommer bli så pass bra prestanda.

Permalänk
Medlem
Skrivet av Morkul:

Jag dual channel men det är som sagt 2*64 bit fortfarande.

Om man ska använda sig av ganged mode så måste OS vara anpassat för 128 bitars minnes adressering. Nu kan det vara så att det finns någon version av Windows server som är anpassad för det men vanliga Widnwos versioner är inte det. Eventuellt skulle det komma special versioner av Win 8 som skulle kunna adressera med 128-bit, har dock inte läst på så mycket om det eftersom det.

Problemet i dagsläget är att CPUn arbetar med 64 bitar så att få en 128 bitars buss ger inte så mycket till prestanda boost.

Man faktum kvarstår att ingen av oss här på forumet vet i dagsläget hur det strypta minnes bussen som dessutom ska delas med CPU påverkar prestandan. Finns i och för sig andra saker som kan strypa prestandan också med återigen så vet vi inte hur prestandan bli tills vi får se ordentliga tester. Jag säger inte på något vis att du har fel, bara lite undrande till hur du kan vara så pass säker på att det kommer bli så pass bra prestanda.

Nej. Du har fått allt om bakfoten, det behövs inte 128bit adressering för att du har en 128bit bred buss. Och minneskontrollern arbetar i 128bit, processorn ser inte om det är 2 64-bit moduler eller 1 128bit modul.
Det finns tre sätt att köra på:

1.
Single Channel (1x64bit) Med en eller flera moduler.

2.
Dual Channel (2x64bit, unganged) Med 2 eller flera moduler. Dubbel total bandbredd, flexibelt då två operationer kan göras samtidigt med 64-bit bandbredd per operation.

3.
Dual Channel (1x128bit, ganged) Med 2 eller flera moduler. Dubbel bandbredd på en operation åt gången.

Här har du en artikel om prestandaskillnad mellan 2x64 och 1x128 på Phenom II: http://www.ilsistemista.net/index.php/hardware-analysis/3-the...
Där finns säkert lite matnyttigt för dig.

Och angående bandbreddskraven på proffesionella tillämpningar så har vi fortfarande belägg för att de är lägre än för spel. Fungerar Trinity för spel så fungerar den antagligen ännu bättre för CAD. Hittills har ingen av er lyckats dra fram belägg för att CAD skulle kräva mer bandbredd än spel, samtidigt ser vi att bandbredd är något man nedprioriterar i proffesionella kort. Och att prestandaskillnaden är minimal i CAD på åtminstone konsumentkort med totalt olika bandbredd. Så om du ska fortsätta med detta så dra åtminstone fram ett enda belägg.

Permalänk
Avstängd
Skrivet av Aleshi:

Nej. Du har fått allt om bakfoten, det behövs inte 128bit adressering för att du har en 128bit bred buss. Och minneskontrollern arbetar i 128bit, processorn ser inte om det är 2 64-bit moduler eller 1 128bit modul.
Det finns tre sätt att köra på:

1.
Single Channel (1x64bit) Med en eller flera moduler.

2.
Dual Channel (2x64bit, unganged) Med 2 eller flera moduler. Dubbel total bandbredd, flexibelt då två operationer kan göras samtidigt med 64-bit bandbredd per operation.

3.
Dual Channel (1x128bit, ganged) Med 2 eller flera moduler. Dubbel bandbredd på en operation åt gången.

Här har du en artikel om prestandaskillnad mellan 2x64 och 1x128 på Phenom II: http://www.ilsistemista.net/index.php/hardware-analysis/3-the...
Där finns säkert lite matnyttigt för dig.

Och angående bandbreddskraven på proffesionella tillämpningar så har vi fortfarande belägg för att de är lägre än för spel. Fungerar Trinity för spel så fungerar den antagligen ännu bättre för CAD. Hittills har ingen av er lyckats dra fram belägg för att CAD skulle kräva mer bandbredd än spel, samtidigt ser vi att bandbredd är något man nedprioriterar i proffesionella kort. Och att prestandaskillnaden är minimal i CAD på åtminstone konsumentkort med totalt olika bandbredd. Så om du ska fortsätta med detta så dra åtminstone fram ett enda belägg.

För att utnyttja den extra bandbredden MÅSTE operativsystems minneshantering vara anpassat för att du ska få ut någon extra prestanda, tror du något annat så borde du läsa på mer om minneshantering.

Men men gör som du vill för jag orkar inte diskutera saken längere.

Permalänk
Medlem
Skrivet av Morkul:

För att utnyttja den extra bandbredden MÅSTE operativsystems minneshantering vara anpassat för att du ska få ut någon extra prestanda, tror du något annat så borde du läsa på mer om minneshantering.

Men men gör som du vill för jag orkar inte diskutera saken längere.

Förstår att du inte orkar, blir jobbigt när man inte har argument. Hur mycket operativet kan adressera har inget att göra med minnesbussens bredd att göra. Om minneskontrollern ska spara in data i minnet så kan den göra det i hur många bitar åt gången som den är byggd för, operativsystemet bryr sig bara om att addresseringen är rätt bitlängd så att det hittar rätt.
Hur förklarar du Athlon 64 som hade 128-bitars minnesbuss? Hur förklarar du att de kom upp i 6,1GB/s på DDR400 som hade en teoretisk prestanda på 3,2GB/s per kanal? Det är alltså 95% effektivitet av 128-bitars buss?
http://www.nordichardware.com/test-lab-cpu-chipset/11042-amd-...