Permalänk
Medlem

Memtest för ECC-minnen

Tjena!

Budade häromdagen hem två stycken ECC-minnen till min blivande hemmaserver. Jag ville testa att minnena fungerade utan problem och körde memtest86+ v.4.20 på USB sticka. Problemet är att programmet måste fela då minnena klarar alla tester på en sekund, sedan loopar programmet om sig. Valde ECC-mode i menyn utan förändrat resultat. Laddade sedan hem v.5.01 och denna version beter sig likadant.

Jag beslutade att testa memtest86 (utan plus) och laddade ner deras USB installer men med denna bootar inte datorn från USB utan jag kommer till GRUB. Läste på projektets hemsida att hårdvarusupporten är begränsad, vilket kanske är anledningen.

Så till mina frågor, har ni några tips på andra minnestester som funkar med ECC-minnen? Ska jag testa en äldre version av de olika programmen?

Permalänk
Hedersmedlem
Skrivet av Mackey:

Tjena!

Budade häromdagen hem två stycken ECC-minnen till min blivande hemmaserver. Jag ville testa att minnena fungerade utan problem och körde memtest86+ v.4.20 på USB sticka. Problemet är att programmet måste fela då minnena klarar alla tester på en sekund, sedan loopar programmet om sig. Valde ECC-mode i menyn utan förändrat resultat. Laddade sedan hem v.5.10 och denna version beter sig likadant.

Jag beslutade att testa memtest86 (utan plus) och laddade ner deras USB installer men med denna bootar inte datorn från USB utan jag kommer till GRUB. Läste på projektets hemsida att hårdvarusupporten är begränsad, vilket kanske är anledningen.

Så till mina frågor, har ni några tips på andra minnestester som funkar med ECC-minnen? Ska jag testa en äldre version av de olika programmen?

Då dessa minnen redan har felkorrigering lär du inte behöva köra något sådant.

Läs: http://en.wikipedia.org/wiki/ECC_memory

Lite mer info: http://www.pugetsystems.com/labs/articles/How-to-Check-ECC-RA...

Visa signatur

Stalin var så gammal att de fick Len´in. ;)

Permalänk
Medlem
Skrivet av Jalle64:

Då dessa minnen redan har felkorrigering lär du inte behöva köra något sådant.

Läs: http://en.wikipedia.org/wiki/ECC_memory

Hittar man nå fel lär man ju ändå villa byta ut stickan än att köra med en trasig. Kul med BSOD/Kernel panic i onödan.

Körde memtest86+ 5.01 på min server, gick bra med mina samsung 8GB ECC stickor.

Visa signatur

i9 11900k ||32GB 4000MHz CL15||ASUS ROG STRIX Z590-E||Noctua NH-D15s
Intel Arc a750 ||Samsung 980 pro|| EVGA Supernova G3 850W
Asus xonar essence STX|| Lian-Li O11 Dynamic XL
Asus VG27AQ 165Hz IPS, Sennheiser HD650, Logitech g502 Hero, fUnc f30r, Vortex TAB90M, Audio-Technicha ATR2500x-USB
Server: x10SL7-F, Xeon E3 1230v3, 32GB Samsung ECC ram, 6x3TB WD RED, FD Node 804.

Permalänk
Medlem

Jag antar att TS vill ta reda på hur mycket fel en ECC-sticka genererar, även om den korrigerar det. Vore bra att veta om det är en bit någonstans som är helt trasig. Med ECC korrigeras detta, men skulle det genereras ett fel till i samma område, ja då blir det fel iallafall.

Håller även med Jalle64 att det egentligen inte behövs då det scenariot skulle vara högst osannolikt.

Visa signatur

Kör Linux - Yes! We are the 2 percent! And growing... Föreslå inte ens något Windows-exklusivt om jag inte specifikt frågar efter något till Win.
2600K - 18GB RAM - 1TB HDD - 64GB SSD - GTX 650 Ti Boost
Minnesvärda trådar: 1, 2

Permalänk
Medlem
Skrivet av Jalle64:

Då dessa minnen redan har felkorrigering lär du inte behöva köra något sådant.

Läs: http://en.wikipedia.org/wiki/ECC_memory

Lite mer info: http://www.pugetsystems.com/labs/articles/How-to-Check-ECC-RA...

Exakt men ville kolla om det var fel på minnena, dvs att de inte korrigerade felen.

Skrivet av BergEr:

Hittar man nå fel lär man ju ändå villa byta ut stickan än att köra med en trasig. Kul med BSOD/Kernel panic i onödan.

Körde memtest86+ 5.01 på min server, gick bra med mina samsung 8GB ECC stickor.

Ok, jag antar att testet inte betedde sig som jag beskrev ovan? Hade du ändrat något i inställningarna eller körde du default?

Skrivet av Erwya:

Jag antar att TS vill ta reda på hur mycket fel en ECC-sticka genererar, även om den korrigerar det. Vore bra att veta om det är en bit någonstans som är helt trasig. Med ECC korrigeras detta, men skulle det genereras ett fel till i samma område, ja då blir det fel iallafall.

Håller även med Jalle64 att det egentligen inte behövs då det scenariot skulle vara högst osannolikt.

Precis detta jag ville testa med memtest, för att vara på den säkra sidan

Permalänk
Medlem
Skrivet av Mackey:

Ok, jag antar att testet inte betedde sig som jag beskrev ovan? Hade du ändrat något i inställningarna eller körde du default?

Nej det gick bra, ändrade lite i inställningar ibland men kommer ej ihåg vad.
Testade närmare tusen timmar totalt. Fick bara errors när det gick åska.

Visa signatur

i9 11900k ||32GB 4000MHz CL15||ASUS ROG STRIX Z590-E||Noctua NH-D15s
Intel Arc a750 ||Samsung 980 pro|| EVGA Supernova G3 850W
Asus xonar essence STX|| Lian-Li O11 Dynamic XL
Asus VG27AQ 165Hz IPS, Sennheiser HD650, Logitech g502 Hero, fUnc f30r, Vortex TAB90M, Audio-Technicha ATR2500x-USB
Server: x10SL7-F, Xeon E3 1230v3, 32GB Samsung ECC ram, 6x3TB WD RED, FD Node 804.

Permalänk
Medlem
Skrivet av BergEr:

Nej det gick bra, ändrade lite i inställningar ibland men kommer ej ihåg vad.
Testade närmare tusen timmar totalt. Fick bara errors när det gick åska.

Testade att bränna memtest86+ version 5.01 till skiva nu och det ser ut att fungera som det ska.

Permalänk
Medlem
Skrivet av Jalle64:

Då dessa minnen redan har felkorrigering lär du inte behöva köra något sådant.

Läs: http://en.wikipedia.org/wiki/ECC_memory

Lite mer info: http://www.pugetsystems.com/labs/articles/How-to-Check-ECC-RA...

Klart han måste.
Hade samma diskussion med folk på IRC som körde ECC i dyra servrar. Verkar råda lite missförstånd vad ECC gör.
memtest86+ skriver bara data till adress X och läser sedan data från adress X och jämför om X = X.
memtst86+ ser inte om datorn korrigerade 1bit fel med hjälp av ECC.
memtest86+ kan se om ECC är på eller av men det är en annan sak.
Inte för att jag är nån expert men ECC i en vanlig server/pc kan bara åtgärda 1bit fel per adress.
2 bit fel kan systemet ofta upptäcka men inte korrigera.
Man kan se detta rapporteras i loggar under linux tex i bland.

Så det är fullt möjligt att få fel i memtest86+ med ECC minnen och får man det har man haft minst 2bit fel på en adress.

Har själv fått det på en Opteron rigg en gång i tiden. Fick göra reklamation och köpa nytt ram då det visade sig feltillverkat.

ECC kan som sagt fixa 1bit fel per adress vilket betyder en bit per byte.

Så ECC är inte idiotsäkert och får man fel i memtest86+ med ECC så betyder det att man hade minst 2 bit fel.

Ironiskt nog dog en minneskanal i min andra opteron rig för många år sedan, fick byta moderkort annars gick den inte att boota OS eller ens köra memtest86+ på den.

Så man ska inte tro att ECC minnen per automatik betyder stabil och pålitlig burk. Usel kvalitet, inkomstabilitet förekommer där också.

Så man bör definitivt köra memtest86+ om man byter ram eller misstänker stabilitetsproblem. ECC minskar bara risken för minnesfel den eleminerar inte vanliga faktorer som slitage, inkompatibilitet etc etc.

ECC kräver att datorn är helt frisk för att kunna korrigera fel orsakad av tex kosmisk strålning.

Det intressanta med ECC är ju om man får många felkorrigeringar rapporterade för det kan tyda på mer allvarligt problem som ECC döljer.

Kan ju vara vettigt att köra 2 passes med ECC avslaget i bios om möjligheten finns. Sedan 2 passes med ECC på.
Stabil burk bör klarar flera rundor utan ECC ändå.

Har en gammal retro dator som tyvärr inte finns delar till men den får ofta 1 och 2 bit fel nån gång per dag och är inte direkt stabil lägre och den kör ECC minne.

Permalänk
Hjälpsam

Borde inte detekterade fel lagras under hardware events i loggboken?
(jag har 0 detekterade)

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |