fsck & blocs défectueux Le sujet est résolu

Demande d'aide : c'est ici.
Répondre
MicP
Modérateur
Modérateur
Messages : 896
Inscription : 16 avr. 2016, 22:14
Status : Hors-ligne

Merci pour le retour de la commande smartctl

Code : Tout sélectionner

  5 Reallocated_Sector_Ct
  7 Seek_Error_Rate
  9 Power_On_Hours
187 Reported_Uncorrect
191 G-Sense_Error_Rate
195 Hardware_ECC_Recovered
197 Current_Pending_Sector

   Attribut Id  :  5      7        9    187  191     195    197

                   3  255483967  15059   98  511  138252691  11
 3 heures après :  3  255586910  15062  131  512  111605784   9
40 heures après	:  3  256298338  15099  370  513   73811619   4
Finalement, je ne suis pas sûr qu'avec ce disque (marque/modèle/type/N° de série, etc.)
on puisse se baser sur les informations retournées par la commande smartctl
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

je ne te cacherai pas que la sortie de cette commande n'est pas clair du tout pour moi

J'espère simplement que le disque n'est pas trop malade et que la personne pour qui je fais cette installation bénévolement pourra en profiter un moment.

Cette machine a vécu et je ne suis pas certain que son propriétaire voudra remplacer le disque dur.

Au moins cela lui permettra de découvrir Debian et moi cela me procure une expérience supplémentaire.
**Simple Utilisateur** -- Debian stable - XFCE
MicP
Modérateur
Modérateur
Messages : 896
Inscription : 16 avr. 2016, 22:14
Status : Hors-ligne

Je pense qu'il faudra quand même prévenir cette personne qu'avant de râler (si ça arrive) contre l'incohérence du comportement de Linux (ou et Windows) sur cette machine,
il faudra qu'elle n'oublie pas que l'état de ce disque nous a semblé très incertain et qu'il en est peut-être la cause.

Lui dire aussi qu'un disque dur ne coûte pas si cher que ça, et que si elle voulait plus tard changer de machine, ce nouveau disque pourrait très bien être utilisé sur sa nouvelle machine,
ou/et intégré dans un boîtier USB de moins de 10€ pour servir de disque externe.

Perso, j'ai acheté (il y a quelques années) des disques SSD d'occasion de 64GB qui m'ont coûté moins de 30€ (ça coûterait sans doute deux fois moins maintenant)
et qui ont redonné une deuxième jeunesse à mes EeePC que j'utilise en déplacement.
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

@MicP

Je partage ton opinion et je comptais bien avertir la personne sur l'état de fiabilité du disque,
ainsi que sur la possibilité de le remplacer pour plus performant.

Maintenant, je ne peux prédire l'usage qui en sera fait.

Je vais tester moi même le temps d'installer les logiciels et d'écrire un peu de documentation
... je verrai bien si ça tient le coup ou pas.

Merci pour le conseil :023:
**Simple Utilisateur** -- Debian stable - XFCE
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

@MlcP

Si cela peut te servir pour ta propre expérience,
je remets :

Code : Tout sélectionner

$ sudo smartctl -a /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-3-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Momentus 5400.5
Device Model:     ST9320320AS
Serial Number:    5SX2PXJJ
LU WWN Device Id: 5 000c50 011dc2519
Firmware Version: 0303
User Capacity:    320 072 933 376 bytes [320 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Fri Jun  2 14:04:54 2017 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  734) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 122) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x103f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   109   087   006    Pre-fail  Always       -       22840117
  3 Spin_Up_Time            0x0003   099   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   090   090   020    Old_age   Always       -       10840
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       3
  7 Seek_Error_Rate         0x000f   084   060   030    Pre-fail  Always       -       256610883
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       15141
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       1
 12 Power_Cycle_Count       0x0032   090   090   020    Old_age   Always       -       10479
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       370
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       2
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   060   052   045    Old_age   Always       -       40 (Min/Max 23/40)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       513
192 Power-Off_Retract_Count 0x0032   095   095   000    Old_age   Always       -       10426
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2882
194 Temperature_Celsius     0x0022   040   048   000    Old_age   Always       -       40 (0 9 0 0 0)
195 Hardware_ECC_Recovered  0x001a   044   027   000    Old_age   Always       -       22840117
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       4
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 368 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 368 occurred at disk power-on lifetime: 15094 hours (628 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 cc 86 70 0f  Error: UNC at LBA = 0x0f7086cc = 259032780

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  42 d0 00 cb 86 70 ef 00      01:01:31.133  READ VERIFY SECTOR(S) EXT
  42 d0 00 bc 86 70 ef 00      01:01:27.020  READ VERIFY SECTOR(S) EXT
  42 d0 00 6b 86 70 ef 00      01:01:19.328  READ VERIFY SECTOR(S) EXT
  42 d0 00 62 86 70 ef 00      01:01:15.926  READ VERIFY SECTOR(S) EXT
  42 d0 00 53 86 70 ef 00      01:01:11.810  READ VERIFY SECTOR(S) EXT

Error 367 occurred at disk power-on lifetime: 15094 hours (628 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ca 86 70 0f  Error: UNC at LBA = 0x0f7086ca = 259032778

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  42 d0 00 bc 86 70 ef 00      01:01:27.020  READ VERIFY SECTOR(S) EXT
  42 d0 00 6b 86 70 ef 00      01:01:19.328  READ VERIFY SECTOR(S) EXT
  42 d0 00 62 86 70 ef 00      01:01:15.926  READ VERIFY SECTOR(S) EXT
  42 d0 00 53 86 70 ef 00      01:01:11.810  READ VERIFY SECTOR(S) EXT
  42 d0 00 29 86 70 ef 00      01:01:08.408  READ VERIFY SECTOR(S) EXT

Error 366 occurred at disk power-on lifetime: 15094 hours (628 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 bb 86 70 0f  Error: UNC at LBA = 0x0f7086bb = 259032763

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  42 d0 00 6b 86 70 ef 00      01:01:19.328  READ VERIFY SECTOR(S) EXT
  42 d0 00 62 86 70 ef 00      01:01:15.926  READ VERIFY SECTOR(S) EXT
  42 d0 00 53 86 70 ef 00      01:01:11.810  READ VERIFY SECTOR(S) EXT
  42 d0 00 29 86 70 ef 00      01:01:08.408  READ VERIFY SECTOR(S) EXT
  42 d0 00 b3 85 70 ef 00      01:00:55.287  READ VERIFY SECTOR(S) EXT

Error 365 occurred at disk power-on lifetime: 15094 hours (628 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 6a 86 70 0f  Error: UNC at LBA = 0x0f70866a = 259032682

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  42 d0 00 62 86 70 ef 00      01:01:15.926  READ VERIFY SECTOR(S) EXT
  42 d0 00 53 86 70 ef 00      01:01:11.810  READ VERIFY SECTOR(S) EXT
  42 d0 00 29 86 70 ef 00      01:01:08.408  READ VERIFY SECTOR(S) EXT
  42 d0 00 b3 85 70 ef 00      01:00:55.287  READ VERIFY SECTOR(S) EXT
  42 d0 00 b1 85 70 ef 00      01:00:52.761  READ VERIFY SECTOR(S) EXT

Error 364 occurred at disk power-on lifetime: 15094 hours (628 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 61 86 70 0f  Error: UNC at LBA = 0x0f708661 = 259032673

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  42 d0 00 53 86 70 ef 00      01:01:11.810  READ VERIFY SECTOR(S) EXT
  42 d0 00 29 86 70 ef 00      01:01:08.408  READ VERIFY SECTOR(S) EXT
  42 d0 00 b3 85 70 ef 00      01:00:55.287  READ VERIFY SECTOR(S) EXT
  42 d0 00 b1 85 70 ef 00      01:00:52.761  READ VERIFY SECTOR(S) EXT
  42 d0 00 ab 85 70 ef 00      01:00:50.023  READ VERIFY SECTOR(S) EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     15074         193222664

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

après quelques heures d'utilisation supplémentaires.

J'ai aussi une paires de questions :

1)

Code : Tout sélectionner

9 Power_On_Hours          -O--CK   083   083   000    -    15141
correspond-il (forcément) au total réel des heures de fonctionnement ?
Dans le cas précis, l'estimation "à la louche" serait du double > 30000h
Ce n'est qu'une estimation mais si l'usage réel est largement supérieur à la valeur smart => qu'en conclure pour les autres données?

2) est-ce que :

Code : Tout sélectionner

  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       3
.....
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       4
correspondent à :
MicP a écrit : 11 secteurs qui étaient en attente de ré-allocation.

Mais vu l'augmentation des défauts constatés, je pense que ton disque a un problème mécanique interne.

Code : Tout sélectionner



   Attribut Id :      7      187  191     195    197
                  255483967   98  511  138252691  11
3 heures après :  255586910  131  512  111605784   9
que tu avais noté ?

Merci

@+
**Simple Utilisateur** -- Debian stable - XFCE
MicP
Modérateur
Modérateur
Messages : 896
Inscription : 16 avr. 2016, 22:14
Status : Hors-ligne

Bonjour

Dans mon message #11 je citais ce lien que je reporte ici

dans lequel tu trouveras la description de chaque attribut S.M.A.R.T.

Dans cette même page web tu pourras aussi lire les extraits suivants :

Bien qu’il commence désormais à exister une certaine standardisation entre la plupart des principaux fabricants de disques durs3,
il reste plusieurs problèmes et chaque fabricant, par son approche spécifique, garde une bonne part de ses connaissances secrètes.
En conséquence, S.M.A.R.T. n’est pas toujours implémenté correctement sur de nombreuses plates-formes informatiques en raison de l’absence de logiciels et de matériels standards à toute l’industrie pour l’échange des données S.M.A.R.T.

Les constructeurs suivants supportent un ou plusieurs attributs S.M.A.R.T dans leurs produits : Samsung, Seagate, IBM, Hitachi, Fujitsu, Maxtor, Western Digital.
Ces constructeurs ne s’accordent pas obligatoirement ni sur une définition précise des attributs, ni sur leurs unités de mesure ;
par conséquent, la liste suivante ne devrait être considérée que comme une référence assez générale.

=======
les Date/heure sont celles de tes messages dans ce fil dont j'ai pu extraire les données suivantes :

Code : Tout sélectionner

Current_Pending_Sector  ──────────────────────────────────────────────────┐
Hardware_ECC_Recovered  ──────────────────────────────────────────┐       │
    G-Sense_Error_Rate  ──────────────────────────────────┐       │       │
    Reported_Uncorrect  ──────────────────────────────┐   │       │       │
        Power_On_Hours  ───────────────────────┐      │   │       │       │
       Seek_Error_Rate  ──────────────┐        │      │   │       │       │
 Reallocated_Sector_Ct  ───────┐      │        │      │   │       │       │
                               │      │        │      │   │       │       │
                               v      v        v      v   v       v       v
   jeudi 25 mai  2017 17:10 :  3  255483967  15059   98  511  138252691  11
   jeudi 25 mai  2017 19:55 :  3  255586910  15062  131  512  111605784   9
dimanche 28 mai  2017 13:17 :  3  256298338  15099  370  513   73811619   4
vendredi 02 juin 2017 14:44 :  3  256610883  15141  370  513   22840117   4
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

Merci pour le rappel... et le récapitulatif

=> il semble donc que ce disque est malade

je vais continuer à alimenter ce tableau pour le surveiller,

le fait que les REALOCTED restent à 3 et que les PENDING diminuent
signifie qu'il a pu réutiliser certains secteurs ?

PS: l'extraction des données, tu l'as faite manuellement ou avec une commande ?
**Simple Utilisateur** -- Debian stable - XFCE
Répondre