Debug serveur Centos

Debug serveur Centos - Hardware - Linux et OS Alternatifs

Marsh Posté le 23-12-2013 à 09:10:30    

Bonjour,
J'ai quelques soucis avec un serveur depuis qq temps et j'avoue ne rien y comprendre, en même temps j'y comprends pas grand chose à la base.
Alors c'est un serveur dont je m'occupe et régulièrement depuis qq temps, il devient inaccessible à distance (ssh) et en direct (à l'aide d'une console qui gère 3 machines dont le serveur problématique).
Je le reboote puisque rien n'est accessible, au bouton Power en plus et là tout revient à la normale.
C'est bizarre puisque les alertes d'inaccessibilités arrivent toujours à la même heure, le même jour.
Des tâches sont exécutées toute la semaine : sauvegarde, transfert de fichiers ... et le dimanche à 18h40, heure du lancement d'une tâche le serveur n'est plus accessible.
Comprends rien !! :(

 

Une idée ?
Merci


Message édité par lemime le 23-12-2013 à 09:11:21
Reply

Marsh Posté le 23-12-2013 à 09:10:30   

Reply

Marsh Posté le 24-12-2013 à 13:36:36    

Ca sent la tache qui consomme trop de mémoire => plus de mémoire de dispo, oomkiller se met en marche et flingue des process essentiels au bon fonctionnement de ton système.
 
Et sur ta console, tu n'as aucun message d'erreur du kernel ?


---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.
Reply

Marsh Posté le 25-12-2013 à 20:42:23    

Regarde sur /var/log/messages, tu auras peut-etre une undication.
Sinon comme tu sais quelle est la tache qui flingue tout, essaye de voir si tu peux la lancer de maniere differente.

Reply

Marsh Posté le 27-12-2013 à 07:21:24    

Merci pour vos réponses les gars. Pas vu de messages particulier dans les logs standards. Pas vu de kernel panic mais bon, la console n'est pas vraiment une console au sens où tu l'entends peut-être , plus un kvm.
Bizarre ...

Reply

Marsh Posté le 27-12-2013 à 07:24:00    

ben80 a écrit :

Regarde sur /var/log/messages, tu auras peut-etre une undication.
Sinon comme tu sais quelle est la tache qui flingue tout, essaye de voir si tu peux la lancer de maniere differente.


Ce que j'ai du mal a comprendre, c'est que la plupart du temps ça marche. J'ai un job qui est lancé toutes les 3 heures. Et la bizarrement le dimanche avant que le job ne se lance ou pendant , toujours a la même heure, impossible au serveur distant de lancer sa tâche.

Reply

Marsh Posté le 27-12-2013 à 11:04:55    

Et le job ne loggue rien de ce qu'il est censé faire ?
 
Pour la console, KVM ou pas ça ne change rien, sauf si vous utilisez un serveur graphique ?


---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.
Reply

Marsh Posté le 27-12-2013 à 14:26:25    

Non pas de serveur graphique.
En fait, j'ai une machine qui se connecte sur ce serveur en ssh et le seul log que j'ai c'est no route to host connexion impossible.
Lorsqu'il veut lancer le job, ben pas de connexion.
Et donc à partir de là la machine est inaccessible, en ssh ou en local sur la console.
J'ai rien en fait écran noir. Ma console gère trois serveurs, les deux autres j'ai le prompt, et celui-ci rien.
Seule solution, redémarrer le bouzin au bouton : je dis bouzin parce que c'est vraiment une daube cette machine.


Message édité par lemime le 27-12-2013 à 14:27:56
Reply

Marsh Posté le 28-12-2013 à 15:30:04    

ça fait vraiment vraiment penser à un kill de sshd et même de mingetty (d'où l'impossiblité de se logguer en local), et de sûrement un tas d'autres processus.
 
En attendant de trouver la vrai cause du pb, il faudrait peut-être ajouter un fichier de swap (histoire de ne pas trifouiller les partoches)
Il a combien de ram ce serveur ?


Message édité par T3K le 28-12-2013 à 15:30:21
Reply

Marsh Posté le 28-12-2013 à 17:31:37    

Salut,
Je suis en congé pendant une semaine et reviens le lundi 6.
Je vous tiens au courant dès mon retour et vais investiguer du côté du swap.
Je me suis amusé à installer webmin dessus, peut-être que ça va m'aider un peu.
EN tout cas merci à tous !
Bonne fin d'année !! et à bientôt !

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed