Shinken - Avis, retour d'expérience et test - Logiciels - Linux et OS Alternatifs
Marsh Posté le 27-01-2016 à 17:55:22
Bonjour, si tu n'as jamais touché aux systémes de monito commence par tester munin, il est simple et ses nodes sont il me semble dispo sur toutes les distribution (deste sous Linux et BSD)
Pour une première approche et comprendre le fonctionnement globale de ce genre de tools il me semble pas mal. Aprés tu peux jouer avec les script et niveaux d’alertes.
Pour du monito simple de moins de 30machines c'est vraiment pas mal, perso j'ai réaliser un petit script qui envois des sms suivant les problémes.
PS : Tu ne trouveras presque rien en fr sur shinken, si ce n'est pas deja fait cherche en englais. Tu peux aussi regardé du coté de Nagios dons il est "relativement" proche car "dérivé"
Marsh Posté le 27-01-2016 à 18:08:45
Nagios c'est un peu depassé autant partir sur shinken. Voici une super doc faite par un membre du forum : http://forum.hardware.fr/hfr/syste [...] 6868_1.htm
ca marche plutot bien et c'est beau, compatible avec nagios pour les modules donc vraiment top.
Marsh Posté le 27-01-2016 à 19:01:11
Bonjour et merci,
j'avais déjà vu ce tuto c'était plus histoire d'avoir des retours et si possibles des tests de charge.
Si non je connais assez bien le monitoring pour utiliser Nagios/Centréon sur certains de calculateurs qu'on supervise dans mon équipe et j'ai testé ICINGA 2 également
Le sens de mon post est surtout pour éviter de faire trop de test par manque de temps et de machines de test surtout... Après, je peux toujours partir sur un cluster virtuel mais c'est moins pratique.
Je recherche des avis sur la question et des retours d'usage en milieu pro, peut etre que ma question n'était pas assez claire, désolé du coup.
Marsh Posté le 27-01-2016 à 19:50:19
J'ai tout de suite pensé a un petit jeune de 16ans qui voulait apprendre le monitoring... Pardon ...
Personnellement je n'ai jamais croisé de retour sur shinken pour une véritable utilisation pro. Mais ça rends ta demande d'autant plus intéressante car tu vas pouvoir nous faire partager tes résultat.
Marsh Posté le 27-01-2016 à 20:33:13
l'avantage de shinken par rapport a nagios c'est qu'il est prévu a la base afin de pouvoir repondre a de fortes charges sans forcement devoir installer toute la suite shinken.
Pour ma part sur 2 sites avec 120 postes ca tournes tres bien bonne tenue en charge. Pour le coup nagiis aussi bien soit il est assez lourd, shinken est une reecriture de nagios en python sous forme de module independant donc tres simple a deployer sur du multi site ou pour des grosses infras (comparé a nagios)
Marsh Posté le 28-01-2016 à 07:51:17
Si c'est juste pour un retour d'expérience (référence), je peux te dire qu'il est utilisé dans de nombreuse institutions publiques (désolé on ne peut pas citer les références) et pas mal de grand groupes (en France et à l'étranger). Comme l'a dit snipereyes, shinken à été conçu comme une réponse à la conception vieillissante de nagios (monolithique vs modulaire) et permet de cette manière une très bonne montée en charge par ajout de noeuds. Il permet également de mettre en place des architectures en haute disponibilité. Attention shinken est un framework, c'est a dire la pièce centrale d'une solution de supervision qui répondra au mieux a un besoin mais il nécessite des compétences pour assembler les pièces autour (ui, métrologie, stockage ...), on est donc pas dans la solution intégrée comme centreon, icinga ou zabbix. Si tu cherches une solution avec un vrai support entreprise (j'ai cru comprendre que c'est le cas mais je peux me tromper), alors il vaut mieux te baser sur la version enterprise qui apporte pas mal de choses qui facilite la vie quand on est pas habitué à travailler avec ce genre de solutions (oui pub inside ;-)). Pour terminer shinken apporte pas mal d'amélioration qui a elle seule justifie son choix d'un point de vue productivité (pack de configuration prêt à l'emploi, support des règles métier, génération automatique de service par liste ....). Il existe un très bon support en français par forum sur http://forums.monitoring-fr.org/index.php?board=31.0.
Marsh Posté le 28-01-2016 à 09:49:33
Bonjour,
Merci de vos réponses.
En gros actuellement je fais une veille techno donc c'est plus à titre informatif mais je vous ferai part de mes résultats pour avoir une vue globale de l'outil.
Je travaille dans le milieu HPC du coup l'usage principal sera des gros calculateurs donc l'intérêt de quelque chose de léger prends tout son sens ici.
Pour le moment beaucoup de calculateurs sont sous nagios et la charge CPU/RAM/réseau et même IO empêche de monitorer les noeuds de calcul comme il faudrait. Icinga 2 comme shinken est modulaire et a un mode "agent-less" qui permet de faire des checks passifs ou actifs sans besoin d'installer un client ce qui est assez intéressant mais l'outil est encore trop jeune pour avoir une idée et surtout pour le mettre en prod
Marsh Posté le 28-01-2016 à 11:04:58
Teste naemon : c'est un fork de nagios, en v4. C'est bien plus rapide, ça utilise thruk par défaut Ici on a viré nos nagios3 pour y passer et c'est sans regrets.
Marsh Posté le 28-01-2016 à 14:57:15
C'est du monolithique ou du modulaire?
Marsh Posté le 28-01-2016 à 15:15:22
c'est plutot monolithique (meme si c'est comme nagios et que tu peux utiliser des modules)
Marsh Posté le 28-01-2016 à 15:48:27
Ah ça c'est assez problématique...
Dans un calculateur il faut impérativement avoir des soft le plus léger possible pour ne pas perdre en temps de calcul effectif, un charge trop importante a beaucoup de conséquences à cette échelle.
Nagios est vraiment lourd et "pâteux" mais est encore très utilisé. Cependant de plus en plus d'outils arrivent et eux sont plus opti pour la scallabilité (genre icinga ou shinken) et c'est ce genre de trucs que je recherche
Marsh Posté le 28-01-2016 à 16:06:02
Teste avant de dire Naemon est vraiement plus veloce et mieux optimisé que nagios (v3)
Accessoirement, je ne vois pas l'interet de faire à ce que ton monitoring appartiennent à ton cluster de calcul. Du coup si il est plus "lourd", c'est sans effet. Note bien que je ne parle pas d'avoir des agents sur les machines ici
En parlant d'agent, pourquoi ne pas poser un collectd et analyser ce que lui remonte pour générer tes alertes ? Selon tes besoins ça peut tout à fait etre une solution
Marsh Posté le 28-01-2016 à 16:23:17
C'est à l'étude aussi ^^
Le monitoring des noeuds de calcul sur un supercalculateur c'est juste vital. On ne peut pas perdre des neouds. Le temps de calcul coute trop cher et il faut une dispo le plus proche de 100% possible
Marsh Posté le 28-01-2016 à 16:33:29
j'ai pas dit le contraire hein
Marsh Posté le 29-01-2016 à 10:14:13
Hier j'ai assisté à un MeetUp sur le monitoring et un des mec parlait de Zabbix ça semble intéressant aussi.
Et petit retour sur ce meet up, j'ai entendu parlé d'un outil qui s'appelle new relics c'est juste génial. Il peut faire de la prévision de bugs.
Basiquement, il va analyser toutes le remontée d'infos et analyser les causes probables pour au final te dire ce qui ne va. Par exemple, en cas de surcharge d'un site web, l'outil a détecté que les overloads et la surcharge disque et ainsi de suite étaient du à une RAM défectueuse.Et ça en quelques secondes ... Assez impressionnant et ça peut etre top pour gagner du temps sur ce genre de problèmes.
Marsh Posté le 29-01-2016 à 11:57:12
New relic j'utilise ça depuis un bon moment, c'est assez bien fichu, meme si je trouve que la qualité du service a fort diminué par rapport à avant. A noter que c'est hebergé chez eux, que ça demande un agent sur les machines et que accessoirement, c'est pas donné
Marsh Posté le 08-02-2016 à 11:49:59
Ok, merci pour cette petite précision, je cherche plutôt de l'OpenSource
collectl + colplot si non c'est vraiment pas mal je trouve, ça demande un peu de bidouille pour avoir un truc vraiment exploitable en prod mais je trouve ça vraiment bien et c'est pas gourmand en ressources en plus!
Marsh Posté le 26-01-2016 à 10:38:13
Bonjour,
Dans le cadre d'une veille technologique sur le monitoring, j'étudie shinken.
Est-ce que certains d'entre vous l'utilisent et qu'en pensez-vous de façon générale? Est-ce que vous pourriez me faire un bref retour d'expérience en précisant le cadre d'utilisation?
Si non est-ce que quelqu'un aurait des liens intéressants vers des test du soft (je ne trouve pas beaucoup d'infos sur la charge CPU/RAM/Réseau du soft en fait)
Toute info utile sur le sujet est bonne à prendre!
merci d'avance pour votre aide
---------------
Mon topic sur les configs full AMD: http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0