(Noob fråga) Kärnor vs trådar? Var är det för skillnad?

2018-11-15 09:57

Avstängd

Registrerad: Sep 2018

●

(Noob fråga) Kärnor vs trådar? Var är det för skillnad?

Hej
Kan någon lite smidigt förklara vad som är viktigt när det kommer till ämnet CPU kärnor och dess trådar?
Att kärnor klockas har jag förstått och att kärnor ofta har två trådar var.
Delas effekten av en kärna upp på två trådar eller har varje tråd full effekt.
När man pratar om hur många CPU's ett program kan nyttja menar man då trådar eller faktiska kärnor?

Jag har som exempel inte valt min hårdvara själv alls men när jag tittar under "Resource Monitor" så står det att jag har 8 olika CPU's och alla ligger ganska stabilt på 65%.

Visa signatur

Jag stavar som en kratta och jag vet det, jag lovar att jag gör mitt yttersta för att det ska bli rätt varje gång!

Rapportera Redigera

Citera flera Citera

2018-11-15 10:41

Permalänk

kirayatail

Medlem ★

Plats: Göteborg
Registrerad: Feb 2018

●

Skrivet av PTSD:

Hej
Kan någon lite smidigt förklara vad som är viktigt när det kommer till ämnet CPU kärnor och dess trådar?
Att kärnor klockas har jag förstått och att kärnor ofta har två trådar var.
Delas effekten av en kärna upp på två trådar eller har varje tråd full effekt.
När man pratar om hur många CPU's ett program kan nyttja menar man då trådar eller faktiska kärnor?

Jag har som exempel inte valt min hårdvara själv alls men när jag tittar under "Resource Monitor" så står det att jag har 8 olika CPU's och alla ligger ganska stabilt på 65%.

Gå till inlägget

Får se om jag minns rätt från utbildningen för åtta år sen...
En tråd kan beskrivas som en kö med instruktioner som processorn ska utföra. Varje instruktion motsvaras i regel av ett kommando i Assembly, och ett statement i ett språk på högre nivå (C, Java, Python etc.) översätts oftast till en handfull instruktioner.

När processorn utför en instruktion så görs det i ett antal separata steg, några steg utförs alltid (vid alla instruktioner), men ibland är instruktioner så komplexa att de kräver några extra steg, helt beroende på vad processorn försöker utföra. När jag läste kursen i detta ämnet jobbade vi med 8- och 16-bitarsprocessorer där varje steg motsvarades av en klockpuls, och det tog mellan 3 och 8 steg att utföra en instruktion, alltså var hastigheten att uftföra kodinstruktioner som bäst en tredjedel av klockfrekvensen. Allt detta görs i en processorkärna som innehåller kretsar för att utföra logik/matte, lite lokal lagring för att kunna jobba med mer än ett värde samtidigt (3 * 5 blir svårt om det bara går att jobba med ett tal åt gången), styrenhet för att översätta en instruktionskod till interna elektriska signaler, samt ledningar mellan allt detta och för att få in och ut data ur kärnan.

Hyper Threading (som Intel kallar det när man kör flera trådar på en kärna) dök upp när någon kom på att den där cykeln av 3-8 steg (eller vad det kan motsvaras av på x86) har en viss effekt. Vissa komponenter i kärnan används vid vissa tidpunkter och väntar sedan bara på att nästa instruktion ska dyka upp, typ fem klockpulser senare. Idén gick ut på att börja utföra nästa instruktion innan föregående har avslutats, så att exempelvis steg 1 och steg 4 körs samtidigt. Detta förutsätter att komponenterna som behövs inte är (eller kommer bli) upptagna av den föregående instruktionen, men eftersom designern vet exakt hur varje given instruktion utförs går det att förutspå genom att bara läsa i förväg i kön av instruktioner.

Om jag minns rätt blir inte processorn exakt dubbelt så effektiv (vilket vi ser i task managern där vi plötsligt kan ha 8 logiska processorer (trådar) trots att vi bara har fyra kärnor), men jag har för mig att vissa kombinationer av instruktioner är mer effektiva än 2x, och andra inte. Jag kan tänka mig att 2x är en bra abstraktion. Dessutom simulerar det förhållandet mellan två instruktioner som körs samtidigt.

Det förutsätter nämligen att om instruktion A och B körs på samma kärna, B startar innan A är färdig, så kan inte B vara beroende av resultatet av A, alltså är det säkrast att programmerarna håller koll på vilka uppsättningar kod som kan köras samtidigt eller inte, och därmed dök konceptet om trådning upp inom programmering. Instruktioner som är beroende av tidigare resultat, eller i alla fall av att tidigare instruktioner utförts, körs i samma tråd. Om det är helsäkert att köra en annan uppsättning instruktioner oberoende av den första, så skapar programmet en ny tråd och placerar instruktionerna där.

Nu blir det lite mer komplicerat än så, för en tråd inom programmering är inte alltid 1:1 med en tråd i hårdvara. Operativsystemet placerar varje program som körs i separata processer, och har en funktion som växlar och prioriterar vilken process som ska få sina instruktioner körda på processorn. Därför kunde vi utan problem köra flera program samtidigt även med en enkärning processor utan flera trådar. När flera kärnor och trådar finns tillgängliga så försöker operativsystemet förstås dra nytta av det, men vi vet inte exakt vilket program som kommer köras på vilken kärna eller tråd vid ett givet tillfälle, det är upp till operativsystemet att optimera och fördela. Sista effekten av att programmera för flera trådar är att eftersom programmeraren inte har full kontroll över prioriteringen, så går det inte att förvänta sig att en tråd körs och når ett resultat före en annan, för att kunna göra det måste funktioner för att invänta andra trådar användas, och det blir direkt ännu mer komplicerat.

Rent intellektuellt är det mycket lättare att designa mjukvara som har en förutsägbar logisk följd av när vilka instruktioner utförs. Att programmera parallellt kan vara intuitivt och sjukt effektivt för vissa typer av uppgifter (att köra många oberoende datapunkter genom samma funktion), men på gränsen till omöjligt i andra (ett spel som största delen av tiden väntar på användarens input eller data från nätverket, och inte kan förbereda några händelser innan den inputen dyker upp). Därför är det en ständig debatt kring om exempelvis Threadripper är bättre att spela på än snabbaste i5-an. Spelets karaktär och hur väl programmerarna utnyttjar flera trådar blir i det fallet avgörande för skillnaden i prestanda.

Nu tar vi rast

Senast redigerat 2018-11-15 10:48 grammatik och flöde.

Visa signatur

Vad har jag i min dator? Kopparrör.

Rapportera Redigera

Citera flera Citera (15)

2018-11-15 10:57

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av kirayatail:

När processorn utför en instruktion så görs det i ett antal separata steg, några steg utförs alltid (vid alla instruktioner), men ibland är instruktioner så komplexa att de kräver några extra steg, helt beroende på vad processorn försöker utföra. När jag läste kursen i detta ämnet jobbade vi med 8- och 16-bitarsprocessorer där varje steg motsvarades av en klockpuls, och det tog mellan 3 och 8 steg att utföra en instruktion, alltså var hastigheten att uftföra kodinstruktioner som bäst en tredjedel av klockfrekvensen. Allt detta görs i en processorkärna som innehåller kretsar för att utföra logik/matte, lite lokal lagring för att kunna jobba med mer än ett värde samtidigt (3 * 5 blir svårt om det bara går att jobba med en siffra åt gången), styrenhet för att översätta en instruktionskod till interna elektriska signaler, samt ledningar mellan allt detta och för att få in och ut data ur kärnan.

Gå till inlägget

Detta gäller väldigt gamla processorer som inte är "fully pipelined". En modern processor har ett stort antal exekverings-steg, och alla delar av processorn jobbar samtidigt. Om du har tre instruktioner A, B och C i den ordning, kommer processorns steg 3 jobba med instruktion A samtidigt som steg 2 jobbar med instruktion B, och steg 1 jobbar med instruktion C. De blir som ett löpande band.

När jag säger "väldigt gamla"... i486 är fully pipelined, så det gäller äldre än så. Om du höll på med 8 och 16-bitars processorer, så jobbade de säkert som du beskriver.

Eftersom beskrivningen ovan är lite fel, försöker jag beskriva Hyperthreading på ett annat sätt.

En instruktion kommer in till processorn och avkodas, så att processorn vet vilka enheter som skall vara aktiva och göra jobbet. Dessa avkodade instruktioner skickas sedan till en "dispatcher" som skickar ut instruktionerna till olika exekveringsenheter. Dispatchern kan skicka mer än en instruktion varje klockcykel - om processorn har två heltalsenheter och det kommer två heltalsinstruktioner som kan exekveras parallellt, så skickas bägge ut samma cykel. Moderna Intel processorer kan avkoda 5 instruktioner per cykel (eller hämta 6 från en cache) och skicka ut 8 till olika exekveringsenheter. Det finns flera exemplar av många enheter, bland annat 4 heltalsenheter (som kan lite olika saker i vissa fall).

Poängen är att det kan vara svårt för dispatchern att hitta instruktioner som kan exekveras oberoende av varandra. Här kommer Hyperthreading in. Med Hyperthreading kan processorn jobba med två trådar samtidigt, för att bättre kunna hitta instruktioner som kan utföras oberoende av varandra. Den har alltså två "listor" med arbetsuppgifter att titta på, och kan plocka ut instruktioner fritt från dessa två.

Så det blir inte dubbelt så bra - du har inte fler exekveringsenheter - men du kan utnyttja de du har lite bättre. Räkna med att du får 30% av en kärna, ungefär.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera (5)

2018-11-15 11:13

Permalänk

kirayatail

Medlem ★

Plats: Göteborg
Registrerad: Feb 2018

●

Skrivet av mpat:

Detta gäller väldigt gamla processorer som inte är "fully pipelined". En modern processor har ett stort antal exekverings-steg, och alla delar av processorn jobbar samtidigt. Om du har tre instruktioner A, B och C i den ordning, kommer processorns steg 3 jobba med instruktion A samtidigt som steg 2 jobbar med instruktion B, och steg 1 jobbar med instruktion C. De blir som ett löpande band.

När jag säger "väldigt gamla"... i486 är fully pipelined, så det gäller äldre än så. Om du höll på med 8 och 16-bitars processorer, så jobbade de säkert som du beskriver.

Gå till inlägget

Helt rätt, när jag nämner 3-8 steg per instruktion så syftar jag på en processorarkitektur som jag tror är helt akademisk, 8-bitars all the way. Tror den designades under 2000-talet, men liknade väl mest arkitekturer från 70- tidigt 80-tal kanske. Den var såpass simpel att vi kunde implementera 3-4 instruktioner i styrenheten för hand med labbsladdar och banankontakter.

Den processorn hade inte ens en skugga av funktioner för optimering, multithreading eller fler kärnor fanns inte på kartan, utan vi läste endast om multithreading som ett teoretiskt avsnitt. Det kanske är dumt att blanda exemplen.

Visa signatur

Vad har jag i min dator? Kopparrör.

Rapportera Redigera

Citera flera Citera (1)

2018-11-16 09:29

Permalänk

PTSD

Avstängd