Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1649 connectés 

  FORUM HardWare.fr
  Systèmes & Réseaux Pro
  Infrastructures serveurs

  [ESXi 6.5] Perte d'une banque de données

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

[ESXi 6.5] Perte d'une banque de données

n°154155
kedumuscle
Posté le 27-05-2018 à 20:57:01  profilanswer
 

Bonjour,
 
J'ai un serveur HP sur lequel est installé ESXi 6.5 (plus exactement : ESXi 6.5.0 version 650.9.6.0.28 released on November 2016 and based on ESXi 6.5.0 Vmkernel Release Build 4564106.)
Subitement, mon serveur a perdu une banque de données. Pourtant, le disque dur en question est bien visible dans ESXi.  
 
En cherchant le problème, j'ai suivi cet article https://kb.vmware.com/s/article/2046610 pensant pouvoir résoudre mon problème.  
Comme on peut le voir en gras ci-dessous, mon disque est bien connu par ESXI :
 
[root@ESXi:~] offset="128 2048"; for dev in `esxcfg-scsidevs -l | grep "Console Device:" | awk {'print
$3'}`; do disk=$dev; echo $disk; partedUtil getptbl $disk; { for i in `echo $offset`; do echo "Checking
offset found at $i:"; hexdump -n4 -s $((0x100000+(512*$i))) $disk; hexdump -n4 -s $((0x1300000+(512*$i
))) $disk; hexdump -C -n 128 -s $((0x130001d + (512*$i))) $disk; done; } | grep -B 1 -A 5 d00d; echo "-
--------------------"; done
 
/vmfs/devices/disks/mpx.vmhba32:C0:T0:L0
 
msdos
974 255 63 15663104
4 32 8191 4 128
1 8192 1843199 5 0
5 8224 520191 6 0
6 520224 1032191 6 0
7 1032224 1257471 252 0
8 1257504 1843199 6 0
 
---------------------

/vmfs/devices/disks/naa.600508b1001c2b63c3e5216dbe1ba7dc
gpt
364797 255 63 5860467632
1 2048 5860463804 AA31E02A400F11DB9590000C2911D1B8 vmfs 0
Checking offset found at 2048:
0200000 d00d c001
0200004
1400000 f15e 2fab
1400004
0140001d  44 44 5f 33 00 00 00 00  00 00 00 00 00 00 00 00  |DD_3............|
0140002d  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

 
---------------------
 
/vmfs/devices/disks/naa.600508b1001c413760f7cf004a8de5ab
gpt
243197 255 63 3906963632
3 128 3906963592 AA31E02A400F11DB9590000C2911D1B8 vmfs 0
Checking offset found at 128:
0110000 d00d c001
0110004
1310000 f15e 2fab
1310004
0131001d  4a 4f 44 57 4e 00 00 00  00 00 00 00 00 00 00 00  |JODWN...........|
0131002d  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
 
---------------------
 
/vmfs/devices/disks/naa.600508b1001c71fc01427153a69ab9c7
gpt
364797 255 63 5860467632
1 128 5860467592 AA31E02A400F11DB9590000C2911D1B8 vmfs 0
Checking offset found at 128:
0110000 d00d c001
0110004
1310000 f15e 2fab
1310004
0131001d  44 44 5f 32 00 00 00 00  00 00 00 00 00 00 00 00  |DD_2............|
0131002d  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
 
---------------------
 
/vmfs/devices/disks/naa.600508b1001cacb17e7e074c24ad122d
gpt
58365 255 63 937637552
1 128 937637512 AA31E02A400F11DB9590000C2911D1B8 vmfs 0
Checking offset found at 128:
0110000 d00d c001
0110004
1310000 f15e 2fab
1310004
0131001d  56 4d 5f 44 41 54 41 53  54 4f 52 45 00 00 00 00  |VM_DATASTORE....|
0131002d  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
 
---------------------
 
 Cependant, ma banque de données nommée "DD_3" n'est pas visible dans l'interface, et la conséquence de tout ça est que certaines VM ne peuvent plus utiliser cette espace car le lien semble rompu.  
Les autres banques de données : DD_2, VM_DATASTORE et JDOWN sont elles bien visible et opérationnelles.  
 
https://communities.vmware.com/servlet/JiveServlet/downloadImage/2-2772927-228697/1600-240/snip_20180527180908.png
 
Je n'arrive pas à comprendre ce qui cloche...  
Avez-vous une idée pour rendre cette banque de données de nouveau opérationnelle ?
Merci d'avance.
 
Merci d'avance.  :hello:

mood
Publicité
Posté le 27-05-2018 à 20:57:01  profilanswer
 

n°154158
Av3k
Posté le 28-05-2018 à 09:46:30  profilanswer
 

Il s'agit d'un datastore pointant sur un disque physique de l'esxi? d'une baie?

n°154159
kedumuscle
Posté le 28-05-2018 à 10:30:05  profilanswer
 

Il s'agit effectivement d'un datastore pointant sur un disque physique.  
En fait dans ma configuration, DD_3 (celui manquant) et DD_2 sont 2 disques identiques de 3To. A la base, je les utilise en RAID 1 logiciel sur une VM, et là du coup mon RAID râle puisqu'il considère qu'un disque est en panne.

n°154162
Av3k
Posté le 28-05-2018 à 11:50:25  profilanswer
 

Et comment est l’état de ton disque physique? Tu as essayé de le rajouter via ton vcenter?

n°154163
kedumuscle
Posté le 28-05-2018 à 11:53:07  profilanswer
 

Comment puis-je faire cette opération ? En essayant de créant un nouveau datastore ? Si c'est le cas, il  n'est pas visible lors de la création d'un datastore.  
A priori, en redémarrant l'hôte et en allant dans les paramètres de démarrage, le disque dur est bien reconnu.

n°154169
Av3k
Posté le 28-05-2018 à 14:30:14  profilanswer
 

Du coup il est de nouveau visible dans l'interface web après reboot? Tu doit avoir un lien qui est tombé dans ce cas...

n°154170
kedumuscle
Posté le 28-05-2018 à 14:36:29  profilanswer
 

Non, justement, je ne le vois plus dans l'interface, comme le montre mon screenshot du premier post.  
En fait, sur mon serveur HP, au boot, je vais regarder si le disque est toujours visible. L'utilitaire HP le détecte bien.  
Arrivé sur l'interface de ESXi, je ne vois plus mon disque... j'ai essayé la méthode du lien de mon premier post, mais le disque est toujours invisible.

n°154173
Av3k
Posté le 28-05-2018 à 15:48:20  profilanswer
 

Etrange, est ce qu'il s'est passé quelque chose de particulier entre temps pour que le système ne detecte plus le disk (genre un reboot?)
 
Sinon essaie de mettre à jour tes firmwares de ton hote.
 
C'est un ssd ou du fc ton disk?

n°154180
kedumuscle
Posté le 28-05-2018 à 16:45:09  profilanswer
 

En fait, le disque a disparu au moment où j'ai fait un rsync entre les données qui étaient sur ce disque et un autre PC (debian 9).  
C'est un disque dur Western Digital Red 3To.  
 
Pour info, j'avais déjà perdu le disque en question il y a environ 80 jours, je l'avais retrouvé en bidouillant sur l'hôte et en récréant un datastore (donc avec pertes des données dessus).  
Je veux bien penser qu'il soit défaillant, mais comment expliqué qu'il fonctionne sans problème pendant 80 jours (24h / 24) en RAID 1 et d'un coup plus rien... sans signe....  
S'il était défaillant, pourquoi l'utilitaire HP le voit bien et ne détecte pas de problème ?

n°154182
Av3k
Posté le 28-05-2018 à 17:17:25  profilanswer
 

La comme ça il est difficile de te répondre... Tu as essayé de re scanner ton stockage sur l'hote via l'interface Esxi?
 
Je ne pense pas qu'il soit defaillant mais peut etre un problème sur ton hote, tes firmwares sont à jours?

mood
Publicité
Posté le 28-05-2018 à 17:17:25  profilanswer
 

n°154186
ShonGail
En phase de calmitude ...
Posté le 28-05-2018 à 20:57:38  profilanswer
 

Des HDD SATA gérés 1 par 1 comme stockage, ça ne sent pas la config pro.
 
C'est quoi ton HP ?
Il n'a pas de contrôleur RAID ?
Il est dans la HCL Vmware ?

n°154195
kedumuscle
Posté le 29-05-2018 à 10:08:26  profilanswer
 

ShonGail a écrit :

Des HDD SATA gérés 1 par 1 comme stockage, ça ne sent pas la config pro.
 
C'est quoi ton HP ?
Il n'a pas de contrôleur RAID ?
Il est dans la HCL Vmware ?


Je te confirme, ce n'est pas pro et ça n'a pas pour but de l'être.  
Le besoin : avoir 2 DD en miroir. Pourquoi VMWare ? Parce qu'en plus de la VM de sauvegarde qui me sert aussi à stocker les images de mes caméras de surveillance, j'ai également une autre VM supportant mon système domotique (Jeedom).
Après si tu as des conseils, je suis preneur ;)
 
HP Micro Server Gen8
Il y a un contrôleur RAID de base.  
Je ne pense pas que le RAID soit dans VMWare.

n°154197
satoshi
Posté le 29-05-2018 à 11:02:38  profilanswer
 

depuis le terminal ssh, tu as quoi quand tu fais:  esxcfg-volume -l
 
Avec un peu de chance, il faut juste remonter le volume, vu que le disque est bien reconnu :)

n°154220
kedumuscle
Posté le 29-05-2018 à 18:52:36  profilanswer
 

satoshi a écrit :

depuis le terminal ssh, tu as quoi quand tu fais:  esxcfg-volume -l
 
Avec un peu de chance, il faut juste remonter le volume, vu que le disque est bien reconnu :)


La commande s'exécute bien, mais ne renvoie rien :
 
[root@ESXi:~] esxcfg-volume -l
[root@ESXi:~]

n°154221
satoshi
Posté le 29-05-2018 à 21:15:34  profilanswer
 

oups, oui, c'est une vieille commande hérité de vSphere 4... à partir de 5 c'était:
 
esxcli storage filesystem list
 
pour lister les volumes qui devrait logiquement être montés

n°154228
redridingh​ood
Posté le 30-05-2018 à 15:16:07  profilanswer
 

tu as un outil de check VMFS egalement depuis la 5.1 : Voma, ca peut valoir le coup de creuser de ce coté.
 
ex : voma -f check -d /vmfs/devices/disks/naa.600508b1001c2b63c3e5216dbe1ba7dc
 


Message édité par redridinghood le 30-05-2018 à 15:17:21
n°154234
kedumuscle
Posté le 30-05-2018 à 20:26:56  profilanswer
 

Pour la 1ère commande, le résultat est le suivant :
 
[root@ESXi:~] esxcli storage filesystem list
Mount Point                                        Volume Name   UUID                                 Mounted  Type             Size           Free
-------------------------------------------------  ------------  -----------------------------------  -------  ------  -------------  -------------
/vmfs/volumes/5874c3b3-d3875f5b-7447-941882374788  VM_DATASTORE  5874c3b3-d3875f5b-7447-941882374788     true  VMFS-5   479962595328   358442074112
/vmfs/volumes/5875155d-3adcf63e-8ee1-941882374788  DD_2          5875155d-3adcf63e-8ee1-941882374788     true  VMFS-6  3000303091712  2266143653888
/vmfs/volumes/5a88434b-f1249e5b-56da-941882374788  JODWN         5a88434b-f1249e5b-56da-941882374788     true  VMFS-6  2000112582656  1007637495808
/vmfs/volumes/8ab460ef-8f592b38-6f16-678a9d8dda9b                8ab460ef-8f592b38-6f16-678a9d8dda9b     true  vfat        261853184       87842816
/vmfs/volumes/5874db13-081b1983-19bb-941882374788                5874db13-081b1983-19bb-941882374788     true  vfat        299712512       83927040
/vmfs/volumes/5fe474e3-6b8f77fb-de9a-30942eac4489                5fe474e3-6b8f77fb-de9a-30942eac4489     true  vfat        261853184       87846912
[root@ESXi:~]
 
==> mon disque DD_3 n'est pas visible....
 
 
Pour la 2ème commande, le résultat est le suivant :
 
[root@ESXi:~] voma -f check -d /vmfs/devices/disks/naa.600508b1001c2b63c3e5216dbe1ba7dc
Module name is missing. Using "vmfs" as default
Checking if device is actively used by other hosts
Running VMFS Checker version 2.1 in check mode
Initializing LVM metadata, Basic Checks will be done
Phase 1: Checking VMFS header and resource files
   Detected VMFS-6 file system (labeled:'DD_3') with UUID:5a8b2bde-2bc24dbb-668e-941882374788, Version 6:81
         ERROR: IO failed: Input/output error
 ON-DISK ERROR: Corruption too severe in resource file [LFB]
         ERROR: Failed to check fbb.sf.
   VOMA failed to check device : IO error
 
Total Errors Found:           1
   Kindly Consult VMware Support for further assistance
[root@ESXi:~]
 
==> j'ai l'impression que ça pue....

n°154235
redridingh​ood
Posté le 31-05-2018 à 09:14:56  profilanswer
 

ca pue, tu peux quand meme essayer l'option fix, on ne sait jamais et aprés tu n'as plus qu'a ouvrir un ticket au support.

n°154236
Av3k
Posté le 31-05-2018 à 09:52:24  profilanswer
 

Ca pue pas forcement, le message peut aussi être du sur un lock sur le FS (genre demontage du VV avec un snapshot en cours dessus...), essaie ce KB :
https://kb.vmware.com/s/article/1009565

n°154318
kedumuscle
Posté le 02-06-2018 à 16:02:23  profilanswer
 

Après avoir testés différents méthodes notamment avec l'aide d'une personne experte dans le domaine, que je remercie au passage, le disque dur est défectueux.
Je lui ai fait passer une série de tests avec les outils Western Digital et les tests sont tous "Failed".
 
Bref, ouverture d'un RMA pour retour du HDD ;)
 
Merci à vous pour le temps que vous m'avez consacré.


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Systèmes & Réseaux Pro
  Infrastructures serveurs

  [ESXi 6.5] Perte d'une banque de données

 

Sujets relatifs
Sauvegarde ESXi version gratuiteMigration d'une VM vers autre ESXi
sauvegarde et partage de données entre plusieurs machinesbackup exec 2014 effacer les données d'un RDX
Serveur Kimsufi : migrer les données vers une autre offreProblème récupération données serveur RAID5 (Windows Server 2003)
Sauvegarde données exchange et archive locale outlook[BI, Big Data, Data Mining] Comment faire parler les données !
[ESXi] Choix carte RAIDRecherche un logiciel d'archivage de données + communication entrepris
Plus de sujets relatifs à : [ESXi 6.5] Perte d'une banque de données


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR