Salut herculanum,
C'est génial ce que tu as fait … le temps que tu as investi pour faire ces tests et revenir vers la communauté pour partager ton propre expérience C'est l'esprit d'entraide !
… et comme on dit « Le savoir n'est ni un devoir ni un droit mais un désir ». Chapeau bas, herculanum !
A knowledge shared is a knowledge gained
Je me permets d'intervenir dans ton sujet juste pour apporter ma pierre à l'édifice
Il s'agit d'une fonctionnalité de WD RED appelée reprise après erreur limitée dans le temps (TLER : Time Limited Error Recovery). Et voici un peu son histoire … ( )
Une grande partie des DD de bureau sont conçus avec la présomption que là il n'y a pas de carte RAID. Tous les DD de bureau procèdent à une correction des erreurs telle que la possibilité de gérer des erreurs d'écriture et réallouer les mauvais secteurs. Durant cette correction le DD ne génère aucun message d'erreur et ne répond pas à des commandes. Les DD de bureau sont conçus avec l'idée qu'ils devraient faire tout leur possible pour mener à bonne fin la correction d'erreur (le design présume qu'il n'y a pas de contrôleur RAID qui pourrait intervenir et apporter de l'aide durant la récupération de l'erreur). La difficulté se produit quand la correction de l'erreur prend plus de 8 secondes et les contrôleurs RAID présument que le DD qui ne répond pas a sauté. Pour cette raison le RAID contrôleur évacue ce DD du volume RAID. Le traitement des erreurs en « manque de coordination » se manifeste lorsque des DD sont dans les conditions d'un E/S chargement intensif ( par ex. les serveurs de vidéo surveillance, les serveurs e-mail ou les serveurs Web trop chargés). En cas de chargement E/S intensif le temps nécessaire pour faire la récupération augmente. Un DD mis dans des conditions d'un chargement E/S continu et effectuant son propre récupération d'erreurs peut facilement excéder ces 8 secondes durant lesquelles un DD standard ne répond pas. Les cartes RAID vont normalement attendre 8 secondes pour que le DD réponde et s'il ne répond pas les cartes RAID sont programmées à prendre des mesures.
Le manque de coordination lors du traitement des erreurs arrive lorsque des DD de bureau sont programmés à prendre en charge toute la récupération d'erreurs et, en même temps, les cartes RAID le sont aussi. Ce manque de coordination entraîne des conséquences importantes. Une fois le DD «évacué» de l'ensemble RAID le volume RAID tourne en mode dégradé jusqu'à ce qu'un DD de remplacement ne soit fourni. Une fois le DD remplacé le volume RAID doit être reconstruit. Lorsque le volume RAID fonctionne en mode dégradé le travail effectué par les disques est très dur. Cela augmente la probabilité de faire la récupération dépasser les 8 secondes. Dès que le DD évacué soit remplacé le volume RAID doit être reconstruit. Pour ce qui est des grands volumes (de 1 à 10 To) le processus de reconstruction peut prendre des heures voire des jours. Les conséquences qu'un deuxième échec sont plus graves que celles du premier. Si un autre DD échoue durant la reconstruction tout le contenu du volume est perdu.Durant la reconstruciton les DD travaillent dur pour gérer en même temps le chargement E/S normal et le chargement E/S de la reconstruciton. Plus leur travail est dur plus la probabilité d'échec augmente.
Les DD destinés aux serveurs sont conçus avec l'idée qu'il y a un contrôleur RAID et qu'une coordination de la gestion des erreurs doit être établie. Cette gestion coordonnée des erreurs est introduite avec TLER (reprise après erreur limitée dans le temps).
Les DD disposant de TLER vont effectuer la récupération d'erreurs normale et arprès la 7-ème seconde ils vont avertir le contrôleur RAID via un message d'erreur et reporter la tâche de récupération de l'erreur. Grâce à la gestion coordinée de l'erreur le DD ne sera pas chassé de la grappe RAID, ceci évitant la récupréaiton du RAID entier, remplacement, reconstruction.
Ensuite la gestion de l'erreur est coordinée entre le DD disposant de TLER et la carte RAID. Le DD TLER répondra sans attendre la solution de l'erreur. La carte RAID signale l'erreur dans le journal des erreurs et délivre des infos en utilisant la protecion avec une parité dédiée jusqu'à ce que le DD réessaie sa propre récupération de l'erreur et sa correction.
Grâce à la gestion coordonnée des erreurs TLER prévient tout nouveau échec de la récupération de l'erreur en limitant le temps que le DD investit pour récupérer cette erreur.
… et voili voilou
WD RED est un DD spécifiquement conçu pour fonctionner dans un environnement RAID à plusieurs disques et est doté de TLER (Time Limited Error Recovery). Bien que TLER soit conçu pour les environnements RAID, un disque avec TLER activée fonctionne sans baisse de performance lorsqu'il est utilisé dans des environnements non-RAID. Donc même si tu utilises WD RED in single mode cela ne devrait pas poser de soucis.
Un peu de lecture :
http://goo.gl/X2wmiy
http://goo.gl/JxbxaO
Cdt,
P.S. Pour ceux qui l'ont lu jusqu'au bout, merci
---------------
http://wdc.com/fr/