Debug serveur Centos - Hardware - Linux et OS Alternatifs
Marsh Posté le 24-12-2013 à 13:36:36
Ca sent la tache qui consomme trop de mémoire => plus de mémoire de dispo, oomkiller se met en marche et flingue des process essentiels au bon fonctionnement de ton système.
Et sur ta console, tu n'as aucun message d'erreur du kernel ?
Marsh Posté le 25-12-2013 à 20:42:23
Regarde sur /var/log/messages, tu auras peut-etre une undication.
Sinon comme tu sais quelle est la tache qui flingue tout, essaye de voir si tu peux la lancer de maniere differente.
Marsh Posté le 27-12-2013 à 07:21:24
Merci pour vos réponses les gars. Pas vu de messages particulier dans les logs standards. Pas vu de kernel panic mais bon, la console n'est pas vraiment une console au sens où tu l'entends peut-être , plus un kvm.
Bizarre ...
Marsh Posté le 27-12-2013 à 07:24:00
ben80 a écrit : Regarde sur /var/log/messages, tu auras peut-etre une undication. |
Ce que j'ai du mal a comprendre, c'est que la plupart du temps ça marche. J'ai un job qui est lancé toutes les 3 heures. Et la bizarrement le dimanche avant que le job ne se lance ou pendant , toujours a la même heure, impossible au serveur distant de lancer sa tâche.
Marsh Posté le 27-12-2013 à 11:04:55
Et le job ne loggue rien de ce qu'il est censé faire ?
Pour la console, KVM ou pas ça ne change rien, sauf si vous utilisez un serveur graphique ?
Marsh Posté le 27-12-2013 à 14:26:25
Non pas de serveur graphique.
En fait, j'ai une machine qui se connecte sur ce serveur en ssh et le seul log que j'ai c'est no route to host connexion impossible.
Lorsqu'il veut lancer le job, ben pas de connexion.
Et donc à partir de là la machine est inaccessible, en ssh ou en local sur la console.
J'ai rien en fait écran noir. Ma console gère trois serveurs, les deux autres j'ai le prompt, et celui-ci rien.
Seule solution, redémarrer le bouzin au bouton : je dis bouzin parce que c'est vraiment une daube cette machine.
Marsh Posté le 28-12-2013 à 15:30:04
ça fait vraiment vraiment penser à un kill de sshd et même de mingetty (d'où l'impossiblité de se logguer en local), et de sûrement un tas d'autres processus.
En attendant de trouver la vrai cause du pb, il faudrait peut-être ajouter un fichier de swap (histoire de ne pas trifouiller les partoches)
Il a combien de ram ce serveur ?
Marsh Posté le 28-12-2013 à 17:31:37
Salut,
Je suis en congé pendant une semaine et reviens le lundi 6.
Je vous tiens au courant dès mon retour et vais investiguer du côté du swap.
Je me suis amusé à installer webmin dessus, peut-être que ça va m'aider un peu.
EN tout cas merci à tous !
Bonne fin d'année !! et à bientôt !
Marsh Posté le 23-12-2013 à 09:10:30
Bonjour,
J'ai quelques soucis avec un serveur depuis qq temps et j'avoue ne rien y comprendre, en même temps j'y comprends pas grand chose à la base.
Alors c'est un serveur dont je m'occupe et régulièrement depuis qq temps, il devient inaccessible à distance (ssh) et en direct (à l'aide d'une console qui gère 3 machines dont le serveur problématique).
Je le reboote puisque rien n'est accessible, au bouton Power en plus et là tout revient à la normale.
C'est bizarre puisque les alertes d'inaccessibilités arrivent toujours à la même heure, le même jour.
Des tâches sont exécutées toute la semaine : sauvegarde, transfert de fichiers ... et le dimanche à 18h40, heure du lancement d'une tâche le serveur n'est plus accessible.
Comprends rien !!
Une idée ?
Merci
Message édité par lemime le 23-12-2013 à 09:11:21