3% badblocks på SSD, bad block försvann vid omformatering

Permalänk
Medlem

3% badblocks på SSD, bad block försvann vid omformatering

Hej Swec!

Lite historia/info, sen mer konkreta frågeställningar längre ner.

Har en 2TB samsung PM9A1Länk
Jag fick 3% badblocks, och fick det verifierat i olika M2 slots, och installerade därmed Windows på en annan SSD.
I HDDSCAN och HDTUNE visade det då fortfarande bad blocks på samma ställen.

När jag gjorde backup fick jag använda Roadkils unstoppable copy, då filer var korrupta.(Primärt en 400gb vhdx fil) och även vissa andra filer.

Efter att jag tog bort partitionerna i Diskpart så slutade alla program rapportera bad blocks.
(admin cmd -> diskpart, sel disk, sel part, delete partition override. På samtliga partitioner på 2tb ssdn.)
Skannade diskarna innan jag formaterade med filsystem och då hittades inga fel.
Sen provade jag sätta disken som NTFS (Vilket den alltid var, som Win10 systemdisk).
Fortfarande hittas inga fel.
Då fyllde jag disken med random filer jag hade liggande tills 50gb var ledigt.
Fortfarande inga fel vid läs/skrivning.

Min tolkning har varit att det är hårdvarufel om det är bad blocks. Då 3% är mycket så borde jag väll ej kunnat fylla disken så mycket som jag gjorde?

Jag hade gjort chkdsk och liknande tidigare och fick ofta korrupta saker som fixades.
Upptäckte även att filer blev korrupta här och var. Så som stora texturmappar

S.M.A.R.T Data visar inget fel. Fick dock temperaturlarm(70c) när jag släpade på 1.9tb filer utan paus. Vid testet, det är. Har alltid innan testet använt kylflens, men tog bort då jag behövde testa i annan m2 slot.
(Smart data nedan, behöll endast relevant ssd)

Klicka för mer information

----------------------------------------------------------------------------
CrystalDiskInfo 8.16.4 (C) 2008-2022 hiyohiyo
Crystal Dew World: https://crystalmark.info/
----------------------------------------------------------------------------

OS : Windows 10 [10.0 Build 19044] (x64)
Date : 2022/05/08 10:46:14

-- Controller Map ----------------------------------------------------------
+ Standard NVM Express Controller [SCSI]
- SAMSUNG MZVL22T0HBLB-00B00

-- Disk List ---------------------------------------------------------------
(05) SAMSUNG MZVL22T0HBLB-00B00 : 2048.4 GB [4/4/0, sq] - nv

----------------------------------------------------------------------------
(05) SAMSUNG MZVL22T0HBLB-00B00
----------------------------------------------------------------------------
Model : SAMSUNG MZVL22T0HBLB-00B00
Firmware : GXB7301Q
Serial Number : S677NF0R302624
Disk Size : 2048.4 GB
Interface : NVM Express
Standard : NVM Express 1.3
Transfer Mode : PCIe 3.0 x4 | PCIe 4.0 x4
Power On Hours : 4850 hours
Power On Count : 238 count
Host Reads : 48159 GB
Host Writes : 19908 GB
Temperature : 35 C (95 F)
Health Status : Good (100 %)
Features : S.M.A.R.T., TRIM, VolatileWriteCache
Drive Letter : T:

-- S.M.A.R.T. --------------------------------------------------------------
ID RawValues(6) Attribute Name
01 000000000000 Critical Warning
02 000000000134 Composite Temperature
03 000000000030 Available Spare
04 00000000000A Available Spare Threshold
05 000000000000 Percentage Used
06 00000605193E Data Units Read
07 0000027D13C3 Data Units Written
08 000025349787 Host Read Commands
09 000020065C1B Host Write Commands
0A 00000000106F Controller Busy Time
0B 0000000000EE Power Cycles
0C 0000000012F2 Power On Hours
0D 000000000035 Unsafe Shutdowns
0E 000000078822 Media and Data Integrity Errors
0F 000000078822 Number of Error Information Log Entries

-- IDENTIFY_DEVICE ---------------------------------------------------------
0 1 2 3 4 5 6 7 8 9
000: 144D 144D 3653 3737 464E 5230 3033 3632 3432 2020
010: 2020 2020 4153 534D 4E55 2047 5A4D 4C56 3232 3054
020: 4248 424C 302D 4230 3030 2020 2020 2020 2020 2020
030: 2020 2020 5847 3742 3033 5131 3802 0025 0700 0006
040: 0300 0001 0D40 0003 9680 0098 0200 0000 0010 0000
050: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
060: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
070: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
080: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
090: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
100: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
110: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
120: 0000 0000 0000 0000 0000 0000 0000 0000 0017 0307
130: 0E16 043F 0101 0162 0166 0000 0000 0000 0000 0000
140: 6000 EEA5 01DC 0000 0000 0000 0000 0000 0000 0000
150: 0000 0000 0000 0000 0000 0000 0000 0000 0023 0000
160: 0000 0001 013E 0164 0002 0000 0000 0000 0000 0000
170: 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000
180: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
190: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
200: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
210: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
220: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
230: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
240: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
250: 0000 0000 0000 0000 0000 0000

-- SMART_NVME --------------------------------------------------------------
+0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
000: 00 34 01 30 0A 00 00 00 00 00 00 00 00 00 00 00
010: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
020: 3E 19 05 06 00 00 00 00 00 00 00 00 00 00 00 00
030: C3 13 7D 02 00 00 00 00 00 00 00 00 00 00 00 00
040: 87 97 34 25 00 00 00 00 00 00 00 00 00 00 00 00
050: 1B 5C 06 20 00 00 00 00 00 00 00 00 00 00 00 00
060: 6F 10 00 00 00 00 00 00 00 00 00 00 00 00 00 00
070: EE 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
080: F2 12 00 00 00 00 00 00 00 00 00 00 00 00 00 00
090: 35 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0A0: 22 88 07 00 00 00 00 00 00 00 00 00 00 00 00 00
0B0: 22 88 07 00 00 00 00 00 00 00 00 00 00 00 00 00
0C0: 02 00 00 00 00 00 00 00 34 01 39 01 00 00 00 00
0D0: 00 00 00 00 00 00 00 00 2D 00 00 00 00 00 00 00
0E0: 2D 03 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
100: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
110: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
120: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
130: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
140: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
150: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
160: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
170: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
180: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
190: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1A0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1B0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1C0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1D0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1E0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00

Visa mer

Frågor:
- Vågar jag lita på SSDn? Jag fick Retur-sedel av Caseking.de, men då det inte längre går bevisa fel så lär det ju bli tillbaka skickat till mig igen.

- Kan jag ändå på något vis bevisa fel?

- Kan Badblock'sen kommit från korrupt vhdx? 3% bad blocks borde vara 50gb av 2tb, men endast 50mb rapporterades som problematiska på vhdx filen. (vhdx filen går fortfarande läsa. Men ej starta i VM) Dock inte enda problemet med disken.

- Försvann badblocks in i ssd'ns overprovisioning område men finns ändå kvar?

- Andra tankar?

Visa signatur

Har jag uppgivit felaktig information? Rätta mig gärna, jag vet inte allt och kan ha fel.

Permalänk
Medlem
Skrivet av Zeedarn:

- Försvann badblocks in i ssd'ns overprovisioning område men finns ändå kvar?

Kanske bara i ett område där inget lagrats (orelaterat till överprovisionering).
Vet inte hur det där testet görs, men med den typ av dynamisk mappning av adresser till fysisk lagring som används så brukar det ju kunna vara så att läsning av oanvända adresser inte triggar någon läsning från nand öht.

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

SSD'er och (HDD'er) har ju båda funktioner som mappar om trasiga "sektorer" till reserverat utrymme.
Du kan läsa i SMART hur mycket som är flyttat.
När det reserverade utrymmet är slut så börjar problemen

Sen så kanske du inte bör använda program från 2008 för att felsöka
Samsung's egna fungerar bättre och kan såklart även tolka SMART korrekt.

Permalänk
Medlem
Skrivet av Svensktiger:

SSD'er och (HDD'er) har ju båda funktioner som mappar om trasiga "sektorer" till reserverat utrymme.
Du kan läsa i SMART hur mycket som är flyttat.
När det reserverade utrymmet är slut så börjar problemen

Sen så kanske du inte bör använda program från 2008 för att felsöka
Samsung's egna fungerar bättre och kan såklart även tolka SMART korrekt.

Har du tips på annan mjukvara, då Samsung's egna mjukvara ej stödjer denna SSD'n?

Visa signatur

Har jag uppgivit felaktig information? Rätta mig gärna, jag vet inte allt och kan ha fel.

Permalänk
Medlem

Post 0E är uppe i 0x78822 event så något problem är det och bör också fungera som 'bevis' i garantiärendet.

Har du haft datorn avstängd i sträck utan att ha startats ens i korta perioder i flera månader ??? sådana fel kan vara för att minnesblocken tappat data med tiden (dålig retension-tid) och felrättningen inte räckte till när du sedan läste och på flashminne kan flera års hållbarhet vid 20 grader C temperatur sjunka till några få veckor om det förvaras vid 30 grader C temperatur... detta gäller all multilevel-flash från alla tillverkare... skall man ha data som är kvar även under lång tid i varm miljö så är det snurrdisk som gäller - de designas i avseende magnetmaterial på skivorna för minst 10 års retension-tid vid 55-60 grader C under hela den tiden.

---

Att låta windows reparera NTFS (vilket görs ofrivilligt innan man som användare kan stoppa detta) är tärningskast ifall den lyckas eller misslyckas - chkdsk kan rädda filsystemen men också kan göra helt otroliga skador på filsystemet i tron att den gör gör rätt, lite som elefant vänder sig i en porslinsbutik...

Har man problem skall man alltid verifiera problemet med annan OS (oftast linux idag) och se om samma fel visar sig där också med tex. en läsningsprov RAW av disken med tex. 'dd' eller 'ddrescue' när man försöker ta en diskimage av SSD:n innan man meckar vidare med olika reparationer som windows chkdsk...

jag vet inte hur RAW 'hdtune' jobbar men går den på metadatat på själva NTFS-filsystemet så kan dina trasiga sektorer istället härröra ifrån chkdsk-reparationen tidigare och inte disken i sig - man skall alltid vara skeptiskt till vad windows och dess program säger när det krånglar - nu har du SMART-fel (0E med många poster) så det kan i det här fallet ändå vara korrekt indikerat av hdtune i det här fallet.

---

Att du inte hittar fel längre beror på att om du tog bort VHDx-filen i windows så skickar windows 'TRIM' för den borttagna filen i små portioner under flera minuter (för att OS inte skall stalla vid borttagning av stor fil - främst gällande SATA-SSD som blockerar SATA-bussen när TRIM körs och på äldre SSD kunde ta en rundlig tid på sig) vilket betyder att de krångliga sektorerna gick till 'återvinning' - dvs. raderas av NVMe:n för att sedan finnas i skriv-poolen för senare skrivning i framtiden.

Det gör att när du testar som du beskriver så har du ingen 'gammal' data då det är det nyskrivna du läser ut igen och inte något som legat i träda i månader på lagring som ej har varit strömsatt under lång tid...

mao. skall du testa detta, så efter skrivning så får du ta ut NVMe-minnet och lägga i skrivbordslådan i ett varmt rum (~ 30 grader C) i 3 månader - koppla in igen och göra en lästest igen...