Problème de RAID sous Debian

Problème de RAID sous Debian - Installation - Linux et OS Alternatifs

Marsh Posté le 09-11-2008 à 22:46:30    

Bonsoir,
 
Voilà, j'ai un soucis avec un serveur (distant) hébergé chez Dedibox.
 
J'ai le disque hda qui est tombé en rade, le soucis, c'est qu'il boote quand même, même si ce dernier est défectueux. Le second disque ne peut donc pas booter. Le RAID n'a donc pas d'action pour éviter la panne.
 
Je tente donc en mode rescue de sortir hda du RAID pour que la Dédibox boote sur le hdb, en attendant le remplacement du disque.
 
J'utilise donc mdadm et voilà les commandes :
 

Code :
  1. mdadm --fail /dev/md0 /dev/sda1
  2. mdadm --fail /dev/md1 /dev/sda2
  3. mdadm --remove /dev/md0 /dev/sda1
  4. mdadm --remove /dev/md1 /dev/sda2


Le soucis, c'est que le second remove ne passe pas. Voici l'erreur :
 

Code :
  1. mdadm: hot remove failed for /dev/sda2: Device or resource busy


En effet, immédiatement après le reboot du serveur, une synchronisation débute et elle rame à mort (normale, le hda est mort).
 
Je veux donc stopper la synchronisation du md1 mais impossible.
 
J'ai bien tenté un :
 

Code :
  1. mdadm --stop /dev/md1 /dev/sda2


Mais du coup, impossible ensuite de le "remove" donc inutile.
 
Ma question est simple, comment avec mdadm stopper une synchronisation afin de pouvoir retirer une partition proprement d'un RAID ?
 
J'ai aussi tenté de booter directement sur le hdb... mais sans succès.
 
Là, je ne peux rien faire.
 
Je vous indique les DETAILS des deux MD pour info :
 

Code :
  1. root@ns:/mnt/grub# mdadm --detail /dev/md0
  2. /dev/md0:
  3.         Version : 00.90.03
  4.   Creation Time : Tue Aug 12 18:47:55 2008
  5.      Raid Level : raid1
  6.      Array Size : 96320 (94.08 MiB 98.63 MB)
  7.   Used Dev Size : 96320 (94.08 MiB 98.63 MB)
  8.    Raid Devices : 2
  9.   Total Devices : 1
  10. Preferred Minor : 0
  11.     Persistence : Superblock is persistent
  12.     Update Time : Sun Nov  9 22:43:18 2008
  13.           State : clean, degraded
  14. Active Devices : 1
  15. Working Devices : 1
  16. Failed Devices : 0
  17.   Spare Devices : 0
  18.            UUID : 8da15552:ad213acc:bfe78010:bc810f04
  19.          Events : 0.62
  20.     Number   Major   Minor   RaidDevice State
  21.        0       0        0        0      removed
  22.        1       8       17        1      active sync   /dev/sdb1


Code :
  1. root@ns:/mnt/grub# mdadm --detail /dev/md1
  2. /dev/md1:
  3.         Version : 00.90.03
  4.   Creation Time : Tue Aug 12 18:47:55 2008
  5.      Raid Level : raid1
  6.      Array Size : 976125376 (930.91 GiB 999.55 GB)
  7.   Used Dev Size : 976125376 (930.91 GiB 999.55 GB)
  8.    Raid Devices : 2
  9.   Total Devices : 2
  10. Preferred Minor : 1
  11.     Persistence : Superblock is persistent
  12.     Update Time : Sun Nov  9 22:45:00 2008
  13.           State : clean, degraded, recovering
  14. Active Devices : 1
  15. Working Devices : 2
  16. Failed Devices : 0
  17.   Spare Devices : 1
  18. Rebuild Status : 0% complete
  19.            UUID : ae2d986e:e1c5f669:bfe78010:bc810f04
  20.          Events : 0.3308798
  21.     Number   Major   Minor   RaidDevice State
  22.        0       8        2        0      active sync   /dev/sda2
  23.        2       8       18        1      spare rebuilding   /dev/sdb2


Merci d'avance de votre aide.


Message édité par thenab le 09-11-2008 à 22:49:26

---------------
Thenab - Quitte à passer pour un con, passe vite !
Reply

Marsh Posté le 09-11-2008 à 22:46:30   

Reply

Marsh Posté le 09-11-2008 à 22:59:26    

Tenez, pour rigoler :
 

Code :
  1. root@ns:/# cat /proc/mdstat
  2. Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
  3. md0 : active raid1 sdb1[1]
  4.       96320 blocks [2/1] [_U]
  5. md1 : active raid1 sda2[0] sdb2[2]
  6.       976125376 blocks [2/1] [U_]
  7.       [>....................]  recovery =  0.0% (768/976125376) finish=40671.8min speed=384K/sec
  8. unused devices: <none>

Reply

Marsh Posté le 09-11-2008 à 23:11:04    

De pire en pire : finish=101679.6min...

Reply

Marsh Posté le 10-11-2008 à 13:57:27    

débrancher le HDD HS ?

Reply

Marsh Posté le 10-11-2008 à 14:12:57    

Je ne suis pas dans les locaux du datacenter de Dédibox ;)...
 
Ceci dit, ils ont remplacé le disque défaillant et maintenant, impossible de remettre le RAID en place.
 
Le md0 se monte sans soucis, mais le md1 pose un problème :
 

Code :
  1. mdadm: No md superblock detected on /dev/md1


---------------
Thenab - Quitte à passer pour un con, passe vite !
Reply

Marsh Posté le 12-11-2008 à 08:44:31    

thenab a écrit :

Je ne suis pas dans les locaux du datacenter de Dédibox ;)...
 
Ceci dit, ils ont remplacé le disque défaillant et maintenant, impossible de remettre le RAID en place.
 
Le md0 se monte sans soucis, mais le md1 pose un problème :
 

Code :
  1. mdadm: No md superblock detected on /dev/md1



As-tu recréé la/les partoche(s) à l'identique sur le nouveau disque ?
 
Sinon tu peux faire un truc du style  :

sfdisk -d /dev/sda > partitioning_scheme
sfdisk /dev/sdb < partitioning_scheme

  En supposant que /dev/sda soit le disque fonctionnel et /dev/sdb le nouveau (à adapter).
 
 
Ensuite :

mdadm --manage  /dev/md1 --add /dev/sdb1

  Où /dev/sdb1 correspond au nouveau disque et à la partoche correspondante (à adapter).
 
 
Pour finir, n'oublie pas d'installer grub dans le MBR du nouveau disque ; en effet, si un beau jour le disque représentant /dev/md0 claque et est remplacé, il faudra pouvoir booter d'une façon ou d'une autre depuis le disque qui vient d'être changé :

grub-install /dev/sdb --recheck

  À adapter, à nouveau, ici /dev/sdb représentant le nouveau disque.


---------------
THRAK (def.) : 1) A sudden and precise impact moving from intention, direction and commitment, in service of an aim. 2) 117 guitars almost striking the same chord simultaneously.
Reply

Marsh Posté le 15-11-2008 à 18:51:18    

thenab a écrit :

Tenez, pour rigoler :
 

Code :
  1. root@ns:/# cat /proc/mdstat
  2. Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
  3. md0 : active raid1 sdb1[1]
  4.       96320 blocks [2/1] [_U]
  5. md1 : active raid1 sda2[0] sdb2[2]
  6.       976125376 blocks [2/1] [U_]
  7.       [>....................]  recovery =  0.0% (768/976125376) finish=40671.8min speed=384K/sec
  8. unused devices: <none>



 
Tu es sur que ça n'est pas ton sdb au niveau de sdb2 qui est hs ...?
 
Si tu en est vraiment sur essaye de monter sdb2
 
mount /dev/sdb2 /mnt/tmp

Reply

Marsh Posté le 15-11-2008 à 20:45:14    

Pour vous donner le fin mot : les deux disques se sont avérés mort.
 
J'ai pu remonter des infos du sda mais tous les changements depuis sept. n'apparaissent pas...
 
Bref, merci Dedibox d'avoir foutu des serveurs PRO équipés de disques défectueux Samsung !
 
Les disques ont été changés, le serveur complètement réinstallé.

Reply

Marsh Posté le 15-11-2008 à 23:26:32    

Ce qui montre que le raid c'est bien, mais qu'il faut toujours avoir des backups des données, configurations, ....

Reply

Marsh Posté le 16-11-2008 à 03:54:59    

Clairement... et que bon, quand les backups se font sur un dédié identique avec aussi des disques pourris, bah :D ...

Reply

Marsh Posté le 16-11-2008 à 03:54:59   

Reply

Marsh Posté le 16-11-2008 à 04:33:26    

Dire qu'un simple HDD externe coûte la peau des fesses [:bighead]
 
 
Je sais pas, mais "implémenter" vous dit quelque chose ?

Reply

Marsh Posté le 16-11-2008 à 08:41:41    

Ton serveur est down depuis septembre et personne s'en ai rendu compte ? :heink:  
Je continue à pas comprendre ces gens qui investissent des fortunes dans des raid mais "économisent" en ne mettant aucun disque de spare ...


---------------
Si la vérité est découverte par quelqu'un d'autre,elle perd toujours un peu d'attrait
Reply

Marsh Posté le 16-11-2008 à 18:15:13    

Non, le RAID pose des soucis depuis septembre, mais non, impossible de s'en rendre compte avant.
 
De plus, je vous rappelle qu'on ne choisi pas la config, c'est un dédié loué... donc un DD externe ou en spare n'est pas disponible chez eux.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed