Fsck : can't open - Hardware - Linux et OS Alternatifs
Marsh Posté le 12-08-2007 à 19:35:26
Si quelqu'un sait aussi s'il existe des outils de diagnostic de disque dur, je pourrais vérifier si le problème vient pas des disques...
Merci
Marsh Posté le 13-08-2007 à 05:39:53
ta partition est elle montée quand tu tentes ton fsck?
Marsh Posté le 13-08-2007 à 07:14:59
Que donnent les commandes metatstat et metadb? Tu as édité le vfstab à la main ? On dirait que qu'il y a un soucis sur le metadevice, peut-être que la base metadb est foireuse ou le mirroir ? Je demanderai à des collègues qui connaissent mieux Solaris que moi, ça m'intéresse aussi
Marsh Posté le 13-08-2007 à 09:22:43
Alors, concernant la partition, je confirme qu'elle n'est pas montée quand je tente le fsck
Le metastat donne ça sur la partition incriminée :
Code :
|
Toutes les autres sont ok aussi
Apparemment, elle a un lien avec d40... je dois dire que j'y comprends pas grand chose. d40 est montée je crois c'est peut être pour ça que je peux pas fsck
Autre truc très bizarre, voila le résultat d'un df -k :
Code :
|
Il y a deux types de structures qui cohabitent : des mirroirs et des partitions simples. C'est pas étrange ça ?
Quant à metadb, c'est du chinois pour moi
Code :
|
Marsh Posté le 13-08-2007 à 10:25:14
Je viens de trouver un peu plus d'explications sur le message de fsck sur le web :
The fsck(1M) command cannot open the disk device, because although a similar filesystem exists, the partition specified does not. Run the mount(1M) or the format(1M) command to see what filesystems are configured on the machine. Then run fsck again on an existing partition. |
Donc cette partition n'existe pas en fait ?
Marsh Posté le 13-08-2007 à 10:28:30
Pour info, voila l'erreur exacte que je vois lors du boot de la machine
|
Pas très parlant pour un non initié
Marsh Posté le 13-08-2007 à 10:35:26
pour ce qui est des tests, tu as la commande format (menu analyze) tu as des tests non destructeurs (il y en a aussi des destructeurs fait gaffe).
Marsh Posté le 13-08-2007 à 10:47:50
tu dis que d40 est montee mais elle n'apparait pas au df, comment tu constates ca?
mais si d200 est un mirroir/raid/stripe/concat/... qui contient d40, il ne faut pas que d40 soit montee!
Tharkun92 a écrit : Il y a deux types de structures qui cohabitent : des mirroirs et des partitions simples. C'est pas étrange ça ? |
pour ca pas de souci, c'est tout a fait possible et normal!
de mon temps (ouaip, ca fait longtemps que j'ai pas touche une machine sun ) il existait un outil pour faire ca en graphique, c'est pas tip top mais ca permet de voir rapidement s'il y a un souci: metatool je crois, je sais pas si ca existe encore sous solaris 9.
Marsh Posté le 13-08-2007 à 11:15:45
Je me suis planté en fait, d40 n'est apparemment pas montée, enfin pas que je sache
J'ai aussi lancé un metastat -p et ça donne ça :
# metastat -p |
Encore une fois, on voit que d200 se distingue, elle est pas comme les autres...
metastat la note comme "Soft Partition", au contraire des autres qui sont des "Mirror" ou "Submirror".
ça peut avoir une importance dans le problème ?
Marsh Posté le 13-08-2007 à 11:20:12
Je poste aussi le metastat complet (un peu long, désolé )
On peut voir qu'il y a un lien entre d200, d201 et d40, mais je ne saurais pas vraiment dire lequel
# metastat |
Marsh Posté le 13-08-2007 à 11:52:26
zoidberg a écrit : pour ce qui est des tests, tu as la commande format (menu analyze) tu as des tests non destructeurs (il y en a aussi des destructeurs fait gaffe). |
Je suis en train de faire tourner un format > analyze > read
Marsh Posté le 13-08-2007 à 14:06:11
Aucun bloc défectueux n'a été trouvé.
Je pense que ça élimine un problème hardware...
Je suis en train d'étudier ce que la commande metarecover peut faire.
Apparemment elle est faite pour réparer les Soft Partitions sur les md...
Marsh Posté le 13-08-2007 à 14:28:31
Code :
|
Marsh Posté le 13-08-2007 à 15:06:42
Pour la postérité voila ce que j'ai fait :
# metarecover -v d40 -p -m Verifying device d201. Verifying device d200. The following extent headers will be written: WARNING: You are about to overwrite portions of d40 Are you sure you want to do this (yes/no)? yes Verifying device d201. Verifying device d200. d40: Verifying metadb allocations match extent headers. Metadb extent: d40: Soft Partition metadb matches extent header configuration |
Marsh Posté le 13-08-2007 à 20:12:22
Hé bein merci Bravo je note tout ça Par contre on m'a dit que sur tes mirroirs n'étaient pas cohérents. En gros tu n'as qu'une patte pour chaque mirroir sur un unique disque. Peut-être qu'un disque a crashé ou que tu comptes en rajouter un plus tard ?
Marsh Posté le 14-08-2007 à 21:48:02
La suite
En fait, après avoir lancé ces commandes, j'ai pu lancer un fsck sur d200.
fsck plante parce qu'il ne trouve pas de superblock sur cette partition.
Heureusement ces superblocks sont apparemment backupés à différents endroits du disque, donc je lance une commande à base de newfs pour connaître les superblocks de backup et les indiquer à fsck.
Au bout du 3ème ou 4ème essai avec des superblocks différents, fsck se lance, mais le nombre d'erreurs sur la partition est énorme.
Je fais plusieurs essais mais au bout d'un moment j'ai pas d'autre choix que de laisser fsck faire son travail.
ça fait que finalement j'ai pu monter cette partition, mais maintenant elle est vide
Pas grave, je me dis que je pourrai surement la backuper avec le submirror d41, après tout ça sert à ça les mirrors...
Je reboote et ô joie, ce sont 2 autres partitions différentes qui se pètent la gueule
fsck m'écrase tout encore une fois et reboot.
Pour finir maintenant la machine ne boote plus, et quand je m'y connecte en hyperterminal avec le serial management, tout ce que j'arrive à avoir c'est des "{1} ok"
Donc à ce moment là j'ai raccroché. Mon taf c'est du fonctionnel, et auparavant je faisais du java, donc j'ai décidé de faire appel à des professionnels aujourd'hui
Voila, merci pour vos conseils en tout cas
Marsh Posté le 12-08-2007 à 14:24:41
Salut à tous,
J'ai eu un problème vendredi dernier avec un solaris 9 : après un reboot, le système n'a pas redémarré normalement, et un filesystem s'est corrompu.
On peut le voir dans les messages de boot : il y a des problèmes de watermark ( ), produisant une checksum invalide (0x0000000, null quoi )
Je fais donc ce que Solaris me conseille, à savoir un fsck sur la partition foireuse (/dev/dsk/md/d200)
Et là il me répond juste :
Fsck : can't open /dev/dsk/md/d200
Et là c'est l'impasse, si vous savez quoi essayer n'hésitez pas