Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bébé Puce

Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour,

 

J'ai acheté recemment un SSD crucial MX200 de 500 Go.

 

J'ai l'impression qu'il est la cause d'écrans bleus impromptus - BSOD - suivis de reboot.
Ca m'arrive environ une fois par jour sans prévenir et je n'arrive pas à trouver une séquence reproductible qui mette le phénomène en évidence.

J'ai utilisé "blue screen view" pour analyser les dumps de mes BSOD et ça parle de :
Bug Check String : PFN_LIST_CORRUPT
Bug Check Code : 0x0000004e
Parameter 1 : 00000000,00000099
Parameter 2 : un chiffre variable
Parameter 3 : 00000000,00000002
Parameter 4 : un chiffre variable
Caused by driver : ntoskrnl.exe

 

Après divers tests et analyses, je pense que le SSD est en cause.

 

En utilisant Storage Executive, je constate un Raw Read Error Rate de 10 erreurs / page (il était de 9 hier). Par ailleurs je suis passé avant hier en firmware MU02 (j'avais aussi le soucis avec le MU01).

 

Qu'est-ce que cela signifie ? Est-ce grave ? J'envisage de remplacer le SDD (RMA) car il est quasiment neuf 36 heures). Que pouvez-vous me dire sur le sujet ?

 

Merci par avance.

 

perf_storage_executive2.jpg

5 RÉPONSES
Gestionnaire de Communauté

Re : Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour Peter3000,



Merci pour votre message. Je suis désolée d’apprendre que vous rencontrez un souci avec votre SSD MX200.


Puisque votre MX200 est détecté en étant en bonne sante, nul besoin de vous soucier des données SMART qui produisent un tas de paramètres différents par rapport au disque mais qui ne reflètent pas le vrai état du disque lorsque ces paramètres sont considérés individuellement.


Je vous recommande de mettre a jour les pilotes SATA de votre ordinateur. Vous pourrez les télécharger a partir du site web du fabriquant de votre ordinateur. Si cela ne résout pas le problème, essayez de changer de type de pilotes, donc si vous utilisez les pilotes Intel, passez a ceux de chez Microsoft et vice versa.


Tenez-moi informée du résultat de vos essais. Si cette réponse vous aide à résoudre le problème, veuillez l’accepter comme solution afin d’en informer le reste de la communauté.


N’hésitez pas à me recontacter pour toutes autres questions.



Cordialement

Crucial_NG, Modérateur Crucial FR
______________________________________________
Comment puis-je savoir quelle mémoire acheter?
Consultez nos produits: FR
Vous pensez que votre mémoire est défectueuse, que faire?
Consultez nos FAQs
Utilisez notre Boîte à idées pour donner votre avis.
Toujours besoin d’aide? Contactez notre Service Client.
Vous souhaitez devenir Super User?
Bébé Puce

Re : Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour,

 

Merci pour votre réponse.

 

Les pilotes SATA sont à jour.

Le disqe est bien aligné.

TRIM = OK

AHCI bien activé.

 

Les drivers intels (avec Rapid Storage) ou microsoft de base ont été essayés (au passage chez moi les drivers intel sont un tout petit peu plus performants, si l'on en croit les benchmarks mais pas de différence notable à l'usage) mais cela ne solutionne pas le problème d'écrans bleus suivis de reboot.

 

J'ai les questions suivantes :

 

1) Que représente le Raw Read Error Rate ?

 

2) Est-ce un compteur qui s'incrémente (du genre il y a eu X ou Y pannes depuis le début d'utilisation du SSD) ou un taux "actuel" (rate en anglais laisse entendre un état actuel) ?

 

3) Je ne crois pas que ces données SMART soient si fausses que cela : j'ai vu sur une configuration similaire à la mienne des données SMART qui donnaient un Raw Read Error Rate = 0/page sur un MX200 de 256Go. Je ne vois donc pas pourquoi chez moi, si je n'avais pas d'erreur, je n'aurais pas 0. Que répendez-vous à cela ?

 

 

 

Gestionnaire de Communauté

Re : Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour  peter3000,

 


Merci pour votre réponse.


Le « Raw Read Error Rate » est le taux d’erreur brut de lecture qui indique le taux d’erreur matérielle lors de la lecture de la surface du disque. En général, il y’aura toujours un nombre d’erreurs lors de la lecture de secteurs mais cela n’indique pas forcement un problème avec le disque. Il est aussi normal que ce taux s’incrémente de 1 pour chaque erreur.


Dans notre industrie, les fabricants de SSDs déterminent un niveau optimum d’erreurs et en créent une échelle. Ce niveau optimum diffère aussi d’un fabriquant a l’autre. Par exemple, si un fabriquant considère que 3 erreurs pour chaque 100 séances de lectures est quasi parfait, il pourra peut être donner une valeur de 100 pour un taux d’erreur de 3/100. De ce fait, en regardant ce taux de 100, le client pourrait être alarmé alors qu’en réalité ceci indique un état parfait du disque.


C’est pour cette raison que je vous ai expliqué dans mon message précédent que ces attributs ne sont pas toujours indicatifs en eux même, de l’état du disque. De plus, les valeurs dépendent de plusieurs autres facteurs. Le logiciel Storage Exécutive est conçu pour interpréter les données SMART et en fonction des valeurs et seuils que nous avons établit pour chaque paramètre, reconnaitra si le SSD est en bonne santé ou pas.


En ce qui concerne les BSOD que vous rencontrez, veuillez tester le SSD sur un autre port/câble SATA si vous avez un ordinateur de bureau. Je vous conseille aussi de tester vos barrettes de mémoire individuellement pour essayer d’isoler le problème et éliminer d’autres causes.

Tenez moi informée du résultat et n’hésitez pas à me recontacter pour toutes autres questions.



Cordialement

Crucial_NG, Modérateur Crucial FR
______________________________________________
Comment puis-je savoir quelle mémoire acheter?
Consultez nos produits: FR
Vous pensez que votre mémoire est défectueuse, que faire?
Consultez nos FAQs
Utilisez notre Boîte à idées pour donner votre avis.
Toujours besoin d’aide? Contactez notre Service Client.
Vous souhaitez devenir Super User?
Bébé Puce

Re : Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour,

 

j'utilise un MX550 dans un contexte où la vitesse de lecture est cruciale: la vitesse nécessaire au bon fonctionnement de mon application est proche de la vitesse maximum du disque. Sur une unité qui fonctionnait parfaitement depuis un an, je constate que les temps de lectures deviennent plus long sur certains secteurs (toujours les mêmes). Le TBW est largement inférieur à celui indiqué par la garantie des disques (16TB contre 72TB pour la garantie). Les SMART me remontent des erreurs de Raw Read Error Rate.

 

Voici mes questions:

1. D'aprés votre explication, j'imagine qu'une erreur RAW peut entrainer une augmentation du temps de lecture (temps dû à la correction d'erreur. Est-ce une conclusion valide?

2. Si c'est le cas, y a t il moyen de marquer ces secteurs comme défectueux?

3. Est-ce un signe de dégradation du disque à cours terme dans le cadre de mon application (bande passante élevée) qui nécessite son remplacement?

 

Voici les données SMART du disque:

smartctl 6.4 2015-06-04 r4109 [x86_64-linux-3.14.44] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Crucial/Micron MX100/MX200/M5x0/M600 Client SSDs
Device Model: Micron_M550_MTFDDAK512MAY
Serial Number: 14100C06845A
LU WWN Device Id: 5 00a075 10c06845a
Firmware Version: MU01
User Capacity: 512,110,190,592 bytes [512 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 6
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Jan 31 16:34:54 2017 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x80) Offline data collection activity
was never started.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 2380) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 6) minutes.
Conveyance self-test routine
recommended polling time: ( 3) minutes.
SCT capabilities: (0x0035) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 32
5 Reallocate_NAND_Blk_Cnt 0x0033 100 100 000 Pre-fail Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 13425
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 24
171 Program_Fail_Count 0x0032 100 100 000 Old_age Always - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age Always - 0
173 Ave_Block-Erase_Count 0x0032 100 100 000 Old_age Always - 3
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 23
180 Unused_Reserve_NAND_Blk 0x0033 000 000 000 Pre-fail Always - 4403
183 SATA_Interfac_Downshift 0x0032 100 100 000 Old_age Always - 0
184 Error_Correction_Count 0x0032 100 100 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 066 058 000 Old_age Always - 34 (Min/Max 21/42)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 16
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 0
202 Percent_Lifetime_Used 0x0031 100 100 000 Pre-fail Offline - 0
206 Write_Error_Rate 0x000e 100 100 000 Old_age Always - 0
210 Success_RAIN_Recov_Cnt 0x0032 100 100 000 Old_age Always - 0
246 Total_Host_Sector_Write 0x0032 100 100 000 Old_age Always - 4513763312
247 Host_Program_Page_Count 0x0032 100 100 000 Old_age Always - 141060939
248 Bckgnd_Program_Page_Cnt 0x0032 100 100 000 Old_age Always - 16632158

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Vendor (0xff) Completed without error 00% 13377 -
# 2 Vendor (0xff) Completed without error 00% 13346 -
# 3 Vendor (0xff) Completed without error 00% 13320 -
# 4 Vendor (0xff) Completed without error 00% 13275 -
# 5 Vendor (0xff) Completed without error 00% 9845 -
# 6 Vendor (0xff) Completed without error 00% 9777 -
# 7 Vendor (0xff) Completed without error 00% 9710 -
# 8 Vendor (0xff) Completed without error 00% 9643 -
# 9 Vendor (0xff) Completed without error 00% 9538 -
#10 Vendor (0xff) Completed without error 00% 9266 -
#11 Vendor (0xff) Completed without error 00% 9198 -
#12 Vendor (0xff) Completed without error 00% 9132 -
#13 Vendor (0xff) Completed without error 00% 9065 -
#14 Vendor (0xff) Completed without error 00% 8998 -
#15 Vendor (0xff) Completed without error 00% 8931 -
#16 Vendor (0xff) Completed without error 00% 8865 -
#17 Vendor (0xff) Completed without error 00% 8797 -
#18 Vendor (0xff) Completed without error 00% 8731 -
#19 Vendor (0xff) Completed without error 00% 8663 -
#20 Vendor (0xff) Completed without error 00% 8597 -
#21 Vendor (0xff) Completed without error 00% 8530 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

 

 

 

Cordialement

Highlighted
Gestionnaire de Communauté

Re : Raw Read Error Rate (MX200 - 500Go) : SSD HS ?

Bonjour Gael,

 

Merci pour votre message. Raw Read Error Rate est le nombre d’erreurs ECC corrigibles et non corrigibles divisé par le nombre total des page NAND lues. Les erreurs ECC qui se produisent lors de la lecture de données « non-utilisateur » contribuent aussi à cette valeur. Cette valeur aussi n’entraine pas forcement non plus une augmentation du temps de performance, car le disque se charge lui-même de marquer les secteurs défectueux en tant que tel et de passer au block suivant.

Storage Exécutive lira toutes les données SMART et en fera un rapport indicatif de l ’état de votre disque. Il n’est pas possible de déterminer l’état de santé du disque à partir d’un seul attribut SMART. Si Storage Exécutive vous indique un état de santé bon, vous n’avez pas besoin de vous soucier.

En ce qui concerne la performance de votre disque, vous pourrez mettre à jour le firmware à la version MU02 car vous semblez être toujours sur la version MU01. La version MU02 comporte les modifications suivantes :

  • Stabilité, efficacité et performances accrues lors des changements d’état d’alimentation
  • Meilleure prise en charge des environnements présentant des alimentations instables
  • Meilleure prise en charge des environnements présentant des problèmes d’intégrité des signaux d’interface SATA
  • Temps de réponse optimisé pour les commandes de lecture SMART
  • Correction de l’erreur de traitement des commandes NCQ Trim
  • Correction du signalement de l’attribut SMART 5

De plus, dans les rares cas au cas où vous remarquerez une perte de performance, il existe une fonctionnalité intégrée dans nos SSDs appelée Active Garbage Collection. Garbage Collection est un type de gestion de la mémoire libérant les secteurs qui ne s’utilisent plus, et ce afin qu'ils puissent être facilement accessible à nouveau. Ce procédé fait partie du contrôleur et fonctionne durant les temps inactifs afin de ne pas affecter les performances, mais permet un accès plus rapide aux secteurs libérés. Laisser Active Garbage Collection fonctionner sur le disque pendant une période prolongée nettoiera les cellules et le SSD fonctionnera à nouveau normalement. Vous trouverez des renseignements supplémentaires sur cette fonction et les différentes façons de l’activer dans l’article suivant de notre base de connaissances : http://communaute.crucial.com/t5/FAQ-SSD/Mon-SSD-est-de-moins-en-moins-performant-Que-se-passe-t-il/...

 

J’espère que ces informations vous seront utiles. Si oui, veuillez accepter cette réponse comme solution afin d’en informer le reste de la communauté. N’hésitez pas à me recontacter pour toutes autres questions.

 

Bien Cordialement

 

Crucial_maulmod, Modérateur Crucial FR
______________________________________________
Comment puis-je savoir quelle mémoire acheter?
Consultez nos produits: FR
Vous pensez que votre mémoire est défectueuse, que faire?
Consultez nos FAQs
Utilisez notre Boîte à idées pour donner votre avis.
Toujours besoin d’aide? Contactez notre Service Client.