Grafikarkitekturen Gen7+

Medan den integrerade grafikdelen klart kan ses som den stora nyheten i Haswell handlar det fortfarande om samma grundarkitektur som återfinns i Ivy Bridge. Intel sticker inte under stolen med det utan kallar arkitekturen för Gen7+, vilket påvisar att det är en inkrementell uppdatering. De större förändringarna har att göra med ökad energieffektivitet och en modulär, skalbar, uppbyggnad.

Gen7+a.jpg
Gen7+b.jpg
Gen7+c.jpg
Gen7+d.jpg
Gen7+e.jpg
Gen7+h.jpg

Gen7 i Ivy Bridge är inte den mest energieffektiva och har svårt att arbeta i sin maximala turbofrekvens i modeller med låga TDP-värden. Detta berodde till viss del på att vissa beräkningar fortfarande sköttes av processorkärnorna. Med Gen7+ flyttas fler beräkningar över till grafikdelen, vilket i sin tur avlastar processorkärnorna.

En innovation från Ivy Bridge som hittar in även här är att Intel integrerade ett mindre L3-cacheminne i grafikdelen. På så vis kan grafikdelen oftare arbeta självständigt utan att behöva använda det L3-cacheminne som delas med processorns kärnor. Som vi gick in på tidigare är det delade L3-cacheminnet numera frikopplat, så det kan även användas av grafikdelen utan att behöva öka spänningen och klockfrekvenserna på processorkärnorna.

Gen7+f.jpg
Gen7+g.jpg

Grafikarkitekturen har två olika segment vilka Intel kan addera utefter behov. Den första är Slice Common som huserar bland annat rasterenheter och det egna L3-cacheminnet. Det andra är Sub-Slice, vilket innehåller beräkningsenheterna. Grafikkonfigurationerna GT1 och GT2 innehåller en Slice Common, medan de omtalade GT3 och GT3e har två stycken.

Vid samma strömbudget presterar flera lägre klockade beräkningsenheter generellt sett bättre än färre högre klockade när det kommer till uppgifter som är lätta att parallellisera. Den här filosofin följdes inte i varken Sandy Bridge (Gen6) eller Ivy Bridge, där det handlade om färre högt klockade beräkningsenheter för grafikdelen.

Den här filosofin omfamnas av Intel med Haswell för att kunna leverera högre grafikprestanda med en lägre strömbudget. Den vanligaste konfigurationen blir GT2 med 20 beräkningsenheter (upp från 16 stycken i Ivy Bridge), medan budgetmodeller i familjerna Celeron och Pentium får klara sig med GT1, vilket innebär 10 beräkningsenheter.

GT3 kommer dock husera hela 40 beräkningsenheter – ett massivt steg från 16 i Ivy Bridge. I första rummet är GT3 tänkt för processorer i segmentet Ultrabook. Dessa modeller kommer få väldigt ambitiösa turbofrekvenser, som grafikdelen i praktiken aldrig kommer nå upp till. Istället kommer de arbeta i lägre klockfrekvenser och klara av att leverera bättre prestanda än en GT2-konfiguration vid samma strömbudget.

eDRAM.jpg

Sist ut är GT3e, där de 40 beräkningsenheterna ackompanjeras med 128 MB DRAM – specialdesignat av Intel och integrerat på samma substrat som processorn. Minnets klockfrekvens ligger på 1,6 GHz och har en 512-bit minnesbuss för en bandbredd på 51,2 GB/s (dubbelriktad). Detta extra minne är inte exklusivt för grafikdelen utan kan även användas av processorkärnorna som ett L4-cacheminne.

Det finns en hake med GT3e. Det är att den endast kommer husera i fyrkärniga processorer med 47 watt TDP för bärbara datorer, samt i fastlött utförande i R-serien på 65 watt TDP för stationära datorer. GT3e uppges vara tillräckligt kraftfull för att kunna mäta sig med Nvidia Geforce GT 650M, ett grafikkort som återfinns i bland annat Macbook Pro Retina (15 tum) samt Asus Zenbook U500VZ.

De kraftfullare GT3 och GT3e kan även köras i vad Intel kallar för "GT2 Mode". Det innebär helt enkelt att halva grafikdelen kan stängas av vid de tillfällen det räcker med halva grafikresurserna. Återigen handlar det om en strömsparfunktion för att maximera batteritiden i bärbara datorer.

Iris_1.png
Iris_3.png
Iris_4.png
Iris_5.png

Grafiknamn

Beräkningsenheter

Kodnamn

TDP

Intel Iris Pro Graphics 5200

40 st. + 128 MB eDRAM

GT3e

47–65W

Intel Iris Graphics 5100

40 st.

GT3

28W

Intel HD Graphics 5000

40 st.

GT3

15W

Intel HD Graphics 4600

20 st.

GT2

37-84W

Intel HD Graphics 4400/4200

20 st.

GT2

11,5-15W

Intel HD Graphics

10 st.

GT1

Okänt

Ovan är en lathund för vilket marknadsföringsnamn som kan förknippas med en viss grafikkonfiguration. Att GT2 och GT3 nämns två gånger beror på att de kommer prestera annorlunda beroende på processorns TDP-värde, vilket i sin tur är avgörande för vilken klockfrekvenserna grafikdelarna kan arbeta i.

Därtill har Gen7+ stöd för DirectX 11.1, OpenGL 4.0 och OpenCL 1.2. Det syns även stöd för upplösningar i upp till 4K (4 096 x 2 304 pixlar) via en Displayport 1.2. Funktionsmässigt syns en ny version av accelerationstekniken Quicksync, som är snabbare och ska ge högre kvalitet på videoklipp än tidigare generationer. Det nya Quicksync ska även hjälpa till att accelerera videoströmning vid exempelvis videokonferenser.

Media1.jpg
Media2.jpg
Media3.jpg
Media4.jpg