Tester son matériel

Tester son matériel - Linux et OS Alternatifs

Marsh Posté le 26-10-2004 à 15:01:09    

Salut,  
 
Le serveur mysql reboote régulirement avec cette erreur dans les logs:

Oct 14 19:07:22 sql2 kernel: swap_dup: Bad swap file entry 8f518046
Oct 14 19:07:22 sql2 kernel: VM: killing process mysqld
Oct 14 19:11:07 sql2 kernel: swap_dup: Bad swap file entry a5f9a046
Oct 14 19:11:07 sql2 kernel: VM: killing process mysqld
Oct 14 19:38:20 sql2 kernel: swap_dup: Bad swap file entry b9fc6046
Oct 14 19:38:20 sql2 kernel: VM: killing process mysqld


 
Il s'agirait donc peut-être d'un problème hardware et il nous faut donc identifier le composant qui foire.
 
Pour tester la ram, il y aurait memtest mais qui demande de booter dessus donc ca impose une présence à côté du serveur. Serait t'il possible de lancer memtest directement depuis linux en enlevant le max d'application qui consomme de la ram? mais vu que il en restera tjs un peu est ce que le test sera bon quand meme?
 
Sinon est ce que vous auriez d'autres softs pour tester le reste du matériel? c'est peut-être la cm ? :??:
 
merci


Message édité par Limit le 26-10-2004 à 15:01:34
Reply

Marsh Posté le 26-10-2004 à 15:01:09   

Reply

Marsh Posté le 26-10-2004 à 15:07:10    

un cluster hs ?


---------------
CPU-Z | Timespy | Mes bd
Reply

Marsh Posté le 26-10-2004 à 15:09:19    

http://www.ultimatebootcd.com/ ?
 
(il existe le même genre de cd, mais uniquement avec des logiciels libres; j'ai par contre oublié le nom de ce cd).


Message édité par _darkalt3_ le 26-10-2004 à 15:11:30
Reply

Marsh Posté le 26-10-2004 à 15:13:00    

chaced a écrit :

un cluster hs ?

non c'est un serveur tout simple.

Reply

Marsh Posté le 26-10-2004 à 15:24:18    

Limit a écrit :

non c'est un serveur tout simple.


 
:D  
 
je parlais de cluster sur le disque dur


---------------
CPU-Z | Timespy | Mes bd
Reply

Marsh Posté le 26-10-2004 à 15:27:03    

cluster du disque dur


---------------
Mandriva : parce que nous le valons bien ! http://linux-wizard.net/index.php
Reply

Marsh Posté le 26-10-2004 à 15:29:09    

chaced a écrit :

:D  
 
je parlais de cluster sur le disque dur


:smiley_qui_rougit: :D
 
Quand je fais un hdparm -tT /dev/sda1 ca donne de bons résultats mais sinon je sais pas plus :??:

Reply

Marsh Posté le 26-10-2004 à 15:31:51    

Limit a écrit :

:smiley_qui_rougit: :D
 
Quand je fais un hdparm -tT /dev/sda1 ca donne de bons résultats mais sinon je sais pas plus :??:


 
Utilise le soft de ton disque dur pour analyser la surface du disque, ou a part si il y a une commande pour faire un scan minutieux directement sous linux.


---------------
CPU-Z | Timespy | Mes bd
Reply

Marsh Posté le 26-10-2004 à 15:33:23    

- activer la fonction SMART dans le BIOS
- installer smartmon ou smartools et faire les tests
- tester les barettes de RAM avec memtest86
- tester le proc avec cpuburn


---------------
Mandriva : parce que nous le valons bien ! http://linux-wizard.net/index.php
Reply

Marsh Posté le 26-10-2004 à 15:33:56    

un ch'tit coup de badblocks sur le disque

Reply

Marsh Posté le 26-10-2004 à 15:33:56   

Reply

Marsh Posté le 26-10-2004 à 15:38:03    

arghbis a écrit :

un ch'tit coup de badblocks sur le disque


 
Voila, c'etait sur que ça existait :D


---------------
CPU-Z | Timespy | Mes bd
Reply

Marsh Posté le 26-10-2004 à 15:50:55    

arghbis a écrit :

un ch'tit coup de badblocks sur le disque

Je viens de tomber là-dessus.  
http://www.mail-archive.com/debuta [...] 25418.html
 

> Hello
> Pour les détecter, se logger en root, mode console (texte), voici la
> commande:
> badblocks -s -w /dev/hda
> -s pour voir la progression du travail
> -w pour faire le test en écrivant sur le disque
> ATTENTION: le test détruit TOUT ce qu'il y avait sur le disque !!!!


 
Ca existe sans perdre les données de son disque dur?

Reply

Marsh Posté le 26-10-2004 à 15:57:49    

normalement, sans le w, tu fais juste le test non destructif. vérifie dans le man

Reply

Marsh Posté le 26-10-2004 à 15:59:26    

Limit a écrit :

Je viens de tomber là-dessus.  
http://www.mail-archive.com/debuta [...] 25418.html
 

> Hello
> Pour les détecter, se logger en root, mode console (texte), voici la
> commande:
> badblocks -s -w /dev/hda
> -s pour voir la progression du travail
> -w pour faire le test en écrivant sur le disque
> ATTENTION: le test détruit TOUT ce qu'il y avait sur le disque !!!!


 
Ca existe sans perdre les données de son disque dur?


 
Ha ok, je viens de trouver, c'est la commande -w qui efface les data
 
il faut faire #badblocks -v -s /dev/hda ;)
 
voir : http://www.rt.com/man/badblocks.8.html


Message édité par chaced le 26-10-2004 à 15:59:48

---------------
CPU-Z | Timespy | Mes bd
Reply

Marsh Posté le 26-10-2004 à 16:27:32    

D'accord et selon vous, je peux l'utiliser sur le serveur en production ou alors il vaut mieux arreter tout ce qui est lancé dessus?


Message édité par Limit le 26-10-2004 à 16:27:46
Reply

Marsh Posté le 26-10-2004 à 16:33:20    

t'as un serveur mirroir? si oui, tu isole celui-la et tu le teste. sinon, ben c dangereux, mais si t'as un cluster défectueux, t'en as peut être plus...

Reply

Marsh Posté le 26-10-2004 à 16:36:21    

Non pas de serveur mirroir, mais je peux faire ce test aux heures qui gènent le moins mais je me demandais si c'est vraiment nécessaire.
Parce que le test pourra être long car c'est un RAID5 composé de 3hdd scsi de 36go

Reply

Marsh Posté le 26-10-2004 à 16:41:30    

oui, ça risque d'être un peu long...

Reply

Marsh Posté le 26-10-2004 à 19:29:39    

Pour memtest, ca marche nickel quand on boote depuis une partition mais c'est possible de le lancer direct depuis Linux, si oui comment? Le fait que toute la ram ne soit pas dispo influe dans le test?
 
merci

Reply

Marsh Posté le 26-10-2004 à 19:45:29    

Limit> devine ... il écrit des données dans la RAM pour faire les tests ( cf motif durant les tests ).


---------------
Mandriva : parce que nous le valons bien ! http://linux-wizard.net/index.php
Reply

Marsh Posté le 26-10-2004 à 22:50:27    

Dark_Schneider a écrit :

Limit> devine ... il écrit des données dans la RAM pour faire les tests ( cf motif durant les tests ).

Oui c'est bien ce que je sais mais il pourrait modifier l'emplacement de ce qui est en mémoire en fonction de ses tests :o et ainsi regarder toute la plage disponible.

Reply

Marsh Posté le 26-10-2004 à 23:03:00    

Limit a écrit :

Oui c'est bien ce que je sais mais il pourrait modifier l'emplacement de ce qui est en mémoire en fonction de ses tests :o et ainsi regarder toute la plage disponible.


 
non, le déplacement ne peut être fait que par le système, c'est lui qui a le dernier mot.

Reply

Marsh Posté le 27-10-2004 à 07:45:44    

Je viens de tester badblocks et je vais vous faire part des résultats.
 

df -h
SysFichier            Tail. Util.Disp. Uti% Monté sur
/dev/sda3              18G  1.7G   15G  10% /
/dev/sda1              99M   15M   80M  16% /boot
/dev/sda2              49G   11G   35G  24% /home
none                  1.7G     0  1.7G   0% /dev/shm


 

badblocks -v -s -o /root/badblocks.txt /dev/sda
Checking for bad blocks in read-only mode
From block 0 to 71829504
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.


 
le shm correspond à quoi?

[root@sql2 root]# badblocks -v -s -o /root/badblocks_shm.txt /dev/shm
Erreur de segmentation


 

[root@sql2 root]# badblocks -v -s -o /root/badblocks_sda3.txt /dev/sda3
Checking for bad blocks in read-only mode
From block 0 to 18482782
Checking for bad blocks (read-only test): done
Pass completed, 2 bad blocks found.


 

[root@sql2 root]# badblocks -v -s -o /root/badblocks_sda1.txt /dev/sda1
Checking for bad blocks in read-only mode
From block 0 to 104391
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.


 

[root@sql2 root]# badblocks -v -s -o /root/badblocks_sda2.txt /dev/sda2
Checking for bad blocks in read-only mode
From block 0 to 51199155
Checking for bad blocks (read-only test): done
Pass completed, 3 bad blocks found.


 
Il a du trouver 2 badblocks et 3badblocks sur sda2. Est t'il possible de bloquer ces 5badblocks pour que le système n'y accède plus du tout?
parce que j'ai les numéros

cat /root/badblocks_sda2.txt
51199152
51199153
51199154


 
merci

Reply

Marsh Posté le 27-10-2004 à 08:04:31    

e2fsck est ton ami
 
e2fsck -c /dev/sda2 pour lister les blocs corrompus et les marquer -en fait, il relance badblocks)
e2fsck -l badblocks_sda2.txt /dev/sda2 pour lire dirctement la sortie précedente de badblocks

Reply

Marsh Posté le 27-10-2004 à 11:23:55    

Je viens de regarder le man et ils disent que c'est ok pour un ext2 journalisé ainsi que le ext3 mais ils ne disent rien pour le ReiserFS.  
C'est ok pour le reiserFS ou existe t'il un outil similaire?
 
merci

Reply

Marsh Posté le 27-10-2004 à 11:30:46    

cherche du coté de reiserfsck alors ;)

Reply

Marsh Posté le 27-10-2004 à 12:26:28    

parfait :)
 
Pour une partition ext3, je vais donc utiliser e2fsck -c /dev/sda2  
 
Pour l'option -c  

-c  
This option causes e2fsck to run the badblocks(8) program to find any blocks which are bad on the filesystem, and then marks them as bad by adding them to the bad block inode. If this option is specified twice, then the bad block scan will be done using a non-destructive read-write test.


Il ne faut pas que je perde des données donc que je spécifie l'option 2fois, comme ca?
e2fsck -c -c /dev/sda2  :??:

Reply

Marsh Posté le 27-10-2004 à 12:34:42    

Si tu fais : e2fsck -c /dev/sda2, badblocks fera un test en lecture seule seulement, comme ça :


MooSe:~# e2fsck -c -y -v /dev/hdb1
e2fsck 1.35 (28-Feb-2004)
 
Vérification de blocs corrompus (test en mode lecture seulement):   1649152/ 15012734


 
Dans le cas de e2fsck -c -c /dev/sda2, il va faire un test de lecture/écriture, mais sans effacer les données du disque (en theorie ;) ).
 
Mais si tu as déjà la liste des blocs défectueux, t'as juste à les passer en paramètres à e2fsck afin qu'il les marque sans rechercher à nouveau.

Reply

Marsh Posté le 27-10-2004 à 12:38:06    

Oui avec ca, e2fsck -l badblocks_sda2.txt /dev/sda2 je n'aurai aucun soucis de perdre la partition? :D
Il marque juste les badblocks sans rien écrire d'autre?

Reply

Marsh Posté le 27-10-2004 à 13:10:18    

Si tout se passe bien, oui :D

Reply

Marsh Posté le 28-10-2004 à 02:46:55    

Impossible de lancer e2fsck :(  
 

e2fsck -vc /dev/sda2
e2fsck 1.32 (09-Nov-2002)
ext2fs_block_iterate: Ext2 file too big while sanity checking the bad blocks inode


 
Alors que l'on a aucun fichier important sur cette partition :??:

Reply

Marsh Posté le 28-10-2004 à 12:11:01    

up

Reply

Marsh Posté le 28-10-2004 à 18:22:23    

une question aussi en passant :D
est ce qu'avoir des badblocks augmente la probabilité d'en réavoir par la suite?  
Je veux dire par là, qu'après avoir marqué ceux-ci comme invalides, j'en aurais plus mais est ce que je risque d'en réavoir d'autres dans le futur plus facilement?
 
merci :)

Reply

Marsh Posté le 29-10-2004 à 16:07:36    

les bad blocks ( cluster défectueux ) sont dus à un pb matériel. commencer à en avoir est le signe que la tête de lecture tape sur la surface des disques par exemple.
 
Bien qu'un formatage bas niveau puisse dans certains cas permettre de réparer les clusters défectueux, c'est quand même annonciateur de pb.


---------------
Mandriva : parce que nous le valons bien ! http://linux-wizard.net/index.php
Reply

Marsh Posté le 30-10-2004 à 03:24:05    

D'accord. ce qui se passe c'est que c'est 3hdds qui sont en raid5, donc il y a les bad blocks sur l'un des trois. C'est possible de savoir sur lequel pour pouvoir le changer?  
 
merci


Message édité par Limit le 30-10-2004 à 03:24:17
Reply

Marsh Posté le 30-10-2004 à 04:39:03    

Il y a eu un problème pour l'utilisation de e2fsck.
 
Badblock voit 51199155 blocks alors que e2fsck en voit 12799788 et donc du coup e2fsck ne voit aucun bloc défectueux donc ne peut pas les corriger ( or ils existent bien :( )  
 

badblocks -v -s /dev/sda2
Checking for bad blocks in read-only mode
From block 0 to 51199155
Checking for bad blocks (read-only test): 511991528/ 51199155
51199153
51199154
done
Pass completed, 3 bad blocks found.


 
Ensuite quand on essaye de faire en sorte que bad blocks aient le meme nombre de block que e2fsck pour pvr utiliser sa sortie, il en trouve 0 également

badblocks -v -s -o /root/badblocks_sda2_4096.txt -b 4096 /dev/sda2
Checking for bad blocks in read-only mode
From block 0 to 12799788
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.


 
Comment faire? [:sisicaivrai]  
Avec e2fsck pas moyen d'arriver à utiliser "le meme comptage" que badblock qui trouve les 3 invalides. C'est possible?
 
Je sais pas si ca a son importance mais les blocks défecteux sont  
51199152
51199153
51199154
donc vers la fin par rapport à 51199155.
 
Enfin voila, je suis à l'écoute de tout  :jap:

Reply

Marsh Posté le 30-10-2004 à 04:56:01    

Est ce que c'est possible de créer une partition du block 0 au block 51199150 histoire d'avoir la partition sans les blocks invalides?
 
merci !

Reply

Marsh Posté le 30-10-2004 à 05:31:57    

bah oui pourquoi tu pourrais pas ??
TU limites ta partition et tu laisses le reste tranquilement dans un coin ;)


---------------
"Parfois brutal, toujours loyal"
Reply

Marsh Posté le 30-10-2004 à 05:37:54    

oui en fait la question porte sur le fait de pouvoir créer du block 0 au block 51199150. Avec fsck je n'ai rien vu dans le man

Reply

Marsh Posté le 30-10-2004 à 13:40:27    

up,  
 
Vous pensez que vu l'erreur  

swap_dup: Bad swap file entry 00000002
VM: killing process mysqld
swap_dup: Bad swap file entry 440f9066
VM: killing process mysqld
swap_dup: Bad swap file entry 473cc066
VM: killing process mysqld
swap_dup: Bad swap file entry 470ed046
VM: killing process mysqld
swap_dup: Bad swap file entry 3a8d0046
VM: killing process mysqld
swap_dup: Bad swap file entry 3a8d0046
VM: killing process mysqld
swap_dup: Bad swap file entry b5dec046
VM: killing process mysqld
swap_dup: Bad swap file entry 783ed046
VM: killing process mysqld
swap_dup: Bad swap file entry 80fd1066
VM: killing process mysqld
swap_dup: Bad swap file entry 8b5cd066
VM: killing process mysqld
swap_dup: Bad swap file entry 80fd1066
VM: killing process mysqld
swap_dup: Bad swap file entry 97cdc046
VM: killing process mysqld
swap_dup: Bad swap file entry 7ecce046
VM: killing process mysqld
swap_dup: Bad swap file entry 9c225066
VM: killing process mysqld
swap_dup: Bad swap file entry b7d54066
VM: killing process mysqld
swap_dup: Bad swap file entry 65133066
VM: killing process mysqld
Unable to handle kernel paging request at virtual address 00010008


 
Ca vient vraiment des 3 bad blocks? Parce que là il parle de Bad swap file, et c'est /home qui contient les bases de données mysql qui a 3bad blocks. Donc ca ne concerne pas le swap à priori :??:  

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed