Intel Skylake fryser vid komplexa beräkningar

Trädvy Permalänk
Inhibitor
Registrerad
Dec 1999

Intel Skylake fryser vid komplexa beräkningar

Efter upptäckten att Intels Skylake-processorer riskerar böjas med vissa kylare uppdagas en bugg i själva kislet, som kraschar systemet vid komplexa beräkningar.

Läs hela artikeln här

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa leder till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Trädvy Permalänk
Medlem
Plats
Malmfälten
Registrerad
Mar 2008

Oj, är det minsta man kan säga, men skönt iaf OM det löser sig med en bios uppdatering. Så det inte blir som med samsungs 840 evo

Lurkar - läser mycket skriver lite. Vill du få min uppmärksamhet är det citat eller pm som gäller.
Jag anser att AIO-kylare har en plats i världen men det är INTE i fullstora ATX-system.

Trädvy Permalänk
Hedersmedlem
Plats
Skåne
Registrerad
Sep 2006
Skrivet av Litenskit:

Oj, är det minsta man kan säga, men skönt iaf OM det löser sig med en bios uppdatering. Så det inte blir som med samsungs 840 evo

Öh, jag tror du överskattar problemet. Detta är väldigt lätt att lösa med en bios-uppdatering.

Det är ingen trasig hårdvara eller underdimensionerade delar.

5960X | X99-E WS | 32GB | EVGA 1080 Ti FTW3 | 2 x Intel 750 | Full Loop | Enthoo Primo
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304

Trädvy Permalänk
Testpilot
Plats
Göteborg
Registrerad
Nov 2002

Jag skulle gärna vilja se om denna mikrokod-uppdatering kan påverka prestandan negativt i vanliga fall.
Kanske bättre att vänta på nästa stepping? =/ Jag som bestämde idag att jag skulle införskaffa en till skylake

Trädvy Permalänk
Bosmang 🤷
Emil Åkered
Plats
Stockholm
Registrerad
Jan 2003

Vad tror ni, en uppdatering av mikrokod som samtidigt råkar ta bort stödet för inofficiell överklockning av icke-K? Bara att välja! #foliehatten

För övrigt anser jag att Karthago bör förstöras.
▪ Nöje #1 -> i5-8400 - Z370M-ITX/ac - GTX 1070 Ti - 16 GB DDR4
▪ Nöje #2 -> R5 2600X - MSI X370 - GTX 1080 Ti - 16 GB DDR4
▪ Mobilt -> Surface Pro 4 - m3-6Y30 - 4 GB DDR3
▪ Konsol -> Playstation 4 Pro - Playstation Vita

Trädvy Permalänk
Medlem
Plats
Kalmar
Registrerad
Jun 2011
Skrivet av emilakered:

Vad tror ni, en uppdatering av mikrokod som samtidigt råkar ta bort stödet för inofficiell överklockning av icke-K? Bara att välja! #foliehatten

Skulle precis skriva detta!
Lagom allvarligt fel för att vanliga användare inte skulle bry sig och sen ett fel som specifikt drabbar många överklockare som stresstestar i Prime.. Fiffigt Intel, fiffigt.

Skickades från m.sweclockers.com

Storburk: i7 2600K@4,0 GHz, ASUS P8P67 Pro-M, FD Define Mini, CMH212+, CM M2 Silent 720W, 16 GB, R9 290X MSI Lightning, SSD + HDD - HTPC: i3 4330T, 4 GB, SSD, XFX HD7850, BeQuiet 550W - Bärbar: ASUS F3SR, Core2Duo@2,6-3,1Ghz 4 GB, SSD

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av SeF.Typh00n:

Öh, jag tror du överskattar problemet. Detta är väldigt lätt att lösa med en bios-uppdatering.

Det är ingen trasig hårdvara eller underdimensionerade delar.

Vissa problem kan inte lösas med mikrokoduppdatering, ett exempel finns ju i artikeln: TSX (man löste kraschen men till "kostnaden" att tappa TSX). Värt att nämna ändå är att TSX inte är trasigt för alla Haswell/Broadwell, man fixade detta problem innan lanseringen av Haswell Xeon E5/E7. Är främst för servers där TSX kan ha en poäng, man använder automatisk TSX i Linux om CPUn har stöd och kärnan är "tillräckligt" ny.

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Registrerad
Okt 2011

Testar inte Intel själva med Prime95? :s

Dom kanske släpper en ny stepping där dom fixar det.
Hoppas att Kaby Lake och Cannon Lake blir renare.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Sep 2013

Det är något med Skylake som alltid får mig att rygga tillbaka och välja en äldre CPU-arkitektur (t.ex. Haswell Refresh) för nya byggen. Känns inte som att det var en riktigt färdig produkt utan att det fortfarande ligger i Beta-stadiet. Och precis som @emilakered skriver så kan detta ge ett skäl för Intel att samtidigt lägga till en mikrokod för att stoppa all överklockning av icke-K CPU:erna

Main || Intel Core i7 980X @ 4.12GHz || ASUS Rampage III Gene || Corsair Vengeance 6x4GB @ 1800MHz || EVGA GTX 780 Reference || Creative Sound Blaster ZxR || 2x Intel 530 240 GB || Western Digital Blue WD10EZEX 1000 GB || ASUS VG248QE (no G-sync) ||
Laptop || Lenovo Thinkpad X220 4291-37G ||
Project: Pentium Clockbox || Intel Pentium G3258 ||

Trädvy Permalänk
Hedersmedlem
Plats
Skåne
Registrerad
Sep 2006
Skrivet av Yoshman:

Vissa problem kan inte lösas med mikrokoduppdatering, ett exempel finns ju i artikeln: TSX (man löste kraschen men till "kostnaden" att tappa TSX). Värt att nämna ändå är att TSX inte är trasigt för alla Haswell/Broadwell, man fixade detta problem innan lanseringen av Haswell Xeon E5/E7. Är främst för servers där TSX kan ha en poäng, man använder automatisk TSX i Linux om CPUn har stöd och kärnan är "tillräckligt" ny.

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Nej det förstås, jag syftade mest på detta specifika problemet

5960X | X99-E WS | 32GB | EVGA 1080 Ti FTW3 | 2 x Intel 750 | Full Loop | Enthoo Primo
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304

Trädvy Permalänk
Hjälpsam
Plats
Karlskoga
Registrerad
Jan 2007

Senast jag kollade implementeras mikrokoden via en kretslogik i CPU:n, i Phenoms fall med TLB-buggen, var "lösningen" att slå av L3 cachen, vilket slog hårt mot prestandan.
I Phenoms fall var "boten värre än soten" för de flesta av oss.

AMD Ryzen 7 1700 | Vega RX 64 | https://valid.x86.fr/fgqnte | Stockkylaren | Bitfenix Whisper M 750W | Corsair 600T Graphite vit.
AMD FX8350 | Polaris RX 460 4 GB | https://valid.x86.fr/0q5pkm | Cooler Master V 700W | 32 GB ECC-Minnen.
HTPC | https://valid.x86.fr/ez1zxw |

Trädvy Permalänk
Avstängd
Registrerad
Jan 2016

Då blir det inte en Skylake :), hoppas på Zen levererar.

En Zen på 1,8GHZ spöar skiten ur en Skylake på 3,5GHZ. (Drömmar)

-Filma inte med din mobil vertikalt-

Trädvy Permalänk
Avstängd
Plats
Oslo, Norge
Registrerad
Aug 2008

Jeg kom tilfeldigvis over denne videoen i dag:
https://www.youtube.com/watch?v=eDmv0sDB1Ak (When hardware must "just work" - An inside look at x86 CPU design [32c3])

Trädvy Permalänk
Medlem
Plats
SweClockers forum
Registrerad
Aug 2012
Skrivet av Nyhet:

Intel Skylake fryser vid komplexa beräkningar

Detta är ju genialiskt! Att ingen tänkt på att processorn ska kyla ner sig själv vid belastning tidigare. Det är ju så uppenbart nu i efterhand.

Guide: Roota din HTC - BB-Kod-knappar på Prisjakt

              Min burk - Kvävekyld till 80%
8700K@stock
1070 Ti@stock

Ibland har jag fel, men då är det någon annans fel.

Trädvy Permalänk
Medlem
Registrerad
Dec 2010
Skrivet av SolidReactor:

Kanske bättre att vänta på nästa stepping? =/ Jag som bestämde idag att jag skulle införskaffa en till skylake

Vadå, ska du köra prime95 24/7? Ja då är det nog bäst att vänta, Skylake är ju sjukt opålitliga just nu.

Skickades från m.sweclockers.com

Ryzen 5 1600, Gigabyte 1070, MSI B350M MORTAR, Crucial 16GB, Samsung EVO 500GB, Define Mini C, Corsair RM550x (╯°□°)╯​︵ ┻━┻

Trädvy Permalänk
Medlem
Registrerad
Aug 2014

@LemonIllusion: HAHA! Bästa idag!

Trädvy Permalänk
Medlem
Plats
Mantorp
Registrerad
Okt 2011
Skrivet av Yoshman:

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Det jag läste vara att felet bara uppstår om man kör med AVX1 (AVX2-varianten går bra) av vissa instruktioner, så man måste ha en specifik version av prime95 (inte för gammal, för då saknas AVX1-stöd, och inte för ny, för då används AVX2 istället), och det är alltså en specifik kombination av instruktioner som används i FFT:n, med vissa specifika bittmönster som indata och en minimal loop-storlek (därav exponenten, som ju är rätt stor), som går fel.

Mer än så vet jag inte, men det som händer iaf är tydligen att tråden låser sig i en minnessynkinstruktion som körs under tiden som istället för efter avx-1 instruktioner, eller något åt det hållet. Man måste använda alla trådar fullt ut, hypertrådning måste vara på, alla load/store enheter måste vara lastade, och man måste trigga en TLB-miss, det är inte direkt 100% chans att det hänger, nej, så rubriken på den här artikeln är aningens missvisande, eftersom det låter som den alltid hänger om man lastar burken.

Fast ska man jaga klick så ska man.

Just det gör det intressant att en firmwareuppdatering av CPU:n (för det är ju det "bios"-uppdateringen är, de ändrar firmwaren som laddas i CPU:n, så egentligen går en linux-uppdatering lika bra, t.ex.) fixar problemet, eller kanske styrs kompilationen från x86-bytekod till native-instruktioner av fimwaren, så de kan ändra på vilka microops som faktiskt används?

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av Ratatosk:

Senast jag kollade implementeras mikrokoden via en kretslogik i CPU:n, i Phenoms fall med TLB-buggen, var "lösningen" att slå av L3 cachen, vilket slog hårt mot prestandan.
I Phenoms fall var "boten värre än soten" för de flesta av oss.

Var inte L3 man slog av även om L2/L3 var involverad i det problem som kunde krascha systemet. Vad man slog av var TLB (translation lookaside buffer), en cache för att översätta från virtuella till fysiska adresser. Det intressanta här var att denna bug inte kunde fixas med mikrokod, men det var möjligt att hantera det i OSet och fanns en (inofficiellt) patch till Linux som löste problemet nästan helt utan prestandaförlust.

Får rätt mig själv ovan: TSX fixades inte till Haswell Xeon E5 utan bara till Haswell Xeon E7, det är däremot fixat i Broadwell Xeon E5 och därmed rimligen även fixat i Broadwell-baserade E-serien. "Fixen" i detta fall var trivial, för att använda något som TSX måste OSet fråga CPUn vilka finesser den stödjer (vissa CPUer saknar ju TSX by-design) så "fixen" är att bara släcker den flagga som säger att TSX stöds. Denna information ligger i själva CPUn och fungerar därför i alla OS utan någon speciell drivare (mer än att man vet hur man läser ut denna information från CPUn, i Linux kan man lista detta med cat /proc/cpuinfo och kolla om flags innehåller TSX).

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Testpilot
Plats
Göteborg
Registrerad
Nov 2002
Skrivet av Marticus:

Vadå, ska du köra prime95 24/7? Ja då är det nog bäst att vänta, Skylake är ju sjukt opålitliga just nu.

Skickades från m.sweclockers.com

Nej, synd att du inte kan läsa mitt inlägg. Onödig spydig kommentar.

Citat:

Jag skulle gärna vilja se om denna mikrokod-uppdatering kan påverka prestandan negativt i vanliga fall.

Prime95 användning är inte ett "vanligt fall", det är ett stresstest. Finns en risk/chans att denna mikrokoduppdatering kanske stänger av en del cache eller instruktioner eller lägger till "omvägar" för att undvika buggen. Hursom vill jag veta om detta kan bli negativt i vanliga fall.

Trädvy Permalänk
Inaktiv
Registrerad
Aug 2012

Den kanske blir slöare än 4790 nu så den inte ska krascha.

Trädvy Permalänk
Medlem
Registrerad
Dec 2010
Skrivet av SolidReactor:

Nej, synd att du inte kan läsa mitt inlägg. Onödig spydig kommentar.

Prime95 användning är inte ett "vanligt fall", det är ett stresstest. Finns en risk/chans att denna mikrokoduppdatering kanske stänger av en del cache eller instruktioner eller lägger till "omvägar" för att undvika buggen. Hursom vill jag veta om detta kan bli negativt i vanliga fall.

Skulle bli ett jäkla liv om normalt användande blir lidande, så tror knappast att en uppdatering pga ett isolerat problem kommer köra över normalt användande. Men du är välkommen att göra en höna av en fjäder och fundera på att döma bort processorarkitekturen helt.

Skickades från m.sweclockers.com

Ryzen 5 1600, Gigabyte 1070, MSI B350M MORTAR, Crucial 16GB, Samsung EVO 500GB, Define Mini C, Corsair RM550x (╯°□°)╯​︵ ┻━┻

Trädvy Permalänk
Medlem
Registrerad
Nov 2004

Som jag har förstått så gäller det 'bara' med HT så 6600K klarar sig från just denna bug.

Skickades från m.sweclockers.com

Trädvy Permalänk
Bildexpert 📺
Thomas Ytterberg
Registrerad
Mar 2013

Lite avslappnande om matematiken bakom och jakten på mersenneprimtal (och vad tusan det handlar om).

Är ju lite prispengar i potten 100.000 dollar till den som först finner ett mersenneprimtal som är 100 miljoner siffror långt. Fast inte för dig med en Skylake då.

Trädvy Permalänk
Avstängd
Registrerad
Dec 2015

Det är väll bara att stänga av fläkten så blir den varm och slipper den frysa....

Core i7 2600@4Ghz - 16GB Corsair Vengenace@1600Mhz - 90GB Corsair Force3 SSD - WD 1TB HDD - EVGA GTX970@1501Mhz - Corsair TX650 PSU - AcerXB270HU 144Hz/GSYNC/1440p - Biltema högtalare med subwoofer. MSI P67A G45 MB *-*-* 11000 poäng Firestrike, 3050 poäng Unigine Heaven, default 2560x1440 *-*-* Windows 7 64. Byggd 2011

Trädvy Permalänk
Medlem
Plats
SR388
Registrerad
Mar 2010

Om den fryser kanske man inte ska ha så effektiv kylning på trots allt.
Edit: Typiskt, någon hann före.

Trädvy Permalänk
Medlem
Plats
Vänersborg
Registrerad
Apr 2012

Inte likt Intel att göra en sån miss, sist var väll z68 kortens sata-portar.

Ha det gött

Intel 7700k | Asus StrixF | Asus 1080ti Strix | Corsair Vengeance 16Gb 3000Mhz | 1,7Tb Ssd | Corsiar Rmx650w | Corsair H115i | Acer XB271HU 165Hz G-Sync | Nzxt s340 Elite¤

Trädvy Permalänk
Testpilot
Plats
Göteborg
Registrerad
Nov 2002
Skrivet av Marticus:

Skulle bli ett jäkla liv om normalt användande blir lidande, så tror knappast att en uppdatering pga ett isolerat problem kommer köra över normalt användande. Men du är välkommen att göra en höna av en fjäder och fundera på att döma bort processorarkitekturen helt.

Skickades från m.sweclockers.com

Enda jag har skrivit om är att jag vill veta om denna mikrokod kommer att påverka prestandan negativt vid vanliga fall. Hur kopplar du denna kommentar från mig till att jag vill döma ut en hel processorarkitektur? Den som gör en höna utav en fjäder är tydligtvis du. Lägg ner.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Jun 2010
Skrivet av Ars Technica:

While the flaw would rarely have been encountered by average users, extensive media coverage ultimately led to Intel recalling the defective processors.

Jaha, så blir det pris-spik igen då eller?

W10 Pro N | i7 6700K @ 4.7 GHz | NH-D15 | GTX 980 Ti HOF | ASUS Z170 Pro Gaming | 16GB 3000Mhz CL15 | Samsung 850 EVO 500GB | 3x HDD ~8TB | Define S | EVGA 750W G2 | Logitech g502 | Corsair K70 Red | Beyerdynamic DT 770 Pro 250Ω | Sound Blaster Z | BenQ XL2430T 144Hz + GW2250HM 60Hz
» Youtube: https://www.youtube.com/c/Phreec

Trädvy Permalänk
Medlem
Plats
Malmö
Registrerad
Maj 2014
Skrivet av Icte:

Det är något med Skylake som alltid får mig att rygga tillbaka och välja en äldre CPU-arkitektur (t.ex. Haswell Refresh) för nya byggen. Känns inte som att det var en riktigt färdig produkt utan att det fortfarande ligger i Beta-stadiet. Och precis som @emilakered skriver så kan detta ge ett skäl för Intel att samtidigt lägga till en mikrokod för att stoppa all överklockning av icke-K CPU:erna

Tycker faktiskt samma sak. Där är för mycket lappning och problem redan innan, och nu plötsligt kan inte ens CPUn räkna rätt.
Och de som tror jag pratar skit, ta en titt på BIOS revisionerna på moderkorten till Skylake. Har aldrig på senaste 10 åren sett så enormt många BIOS uppdateringar på ynka 3 månader som skylake har fått.

Så personligen väntar jag till plattformens buggar bankats ut, och då kan jag lika gärna vänta på att Skylakes bugg bankas ut den med.

@cardeci En CPU som räknar fel är som ett RAM minne som bitflippar... mao, totalt värdelös, oavsett hur osannolikt det är. Man förutsätter alltid att en dator kan räkna rätt och hantera alla tal, kan den inte så behövs det fixas annars kan du inte lita ett dugg på beräkningarna från den, för hur vet du att det är rätt?

Om de nu kan "fixa" via microkod så är ju frågan vad som påverkas, för de måste ju stänga av eller ändra något i CPUerna för att fixa hårdvarufelet.

Trädvy Permalänk
Inaktiv
Registrerad
Aug 2012

Kanske blir någon dipp ner till 1500 strecket får vi hoppas då