[Problèmes] Coupures serveur (flapping)

Coupures serveur (flapping) [Problèmes] - Réseaux - Systèmes & Réseaux Pro

Marsh Posté le 11-04-2012 à 11:32:28    

Bonjour,  
J’ai des problèmes de coupures réseau sur certains serveurs. J’ai utilisé multiping afin d’observer ces coupures (Dans le cœur de réseau ainsi que sur un site distant).  
Voici les résultats :
Courbes 1, 2 et 3 machines virtuelles (2x windows 2003 + 1 linux asterisk TOIP).
Courbes 4 et 5 les machines hôtes.
 
 http://img15.hostingpics.net/pics/263293060416h30localpublic.png
 
- Les serveurs physiques ne sont pas coupés.
- Il n’existe pas de lien logique entre les coupures observées. Les troubles interviennent à des intervalles différents et de manière irrégulière. Les causes ou les conséquences des troubles ne sont observables (événements en cascade).
- Sur les serveurs physiques, nous avons provoqué des perturbations (augmentation du trafic). Le temps de réponse de ces serveurs a augmenté, 41 ms au lieu de 3ms en moyenne. En revanche les serveurs hébergés n’ont pas augmentés leurs taux de pertes. Les coupures ne sont pas liées à une charge importante du réseau (heures de pointe).
 
J’ai fait vérifier la configuration des commutateurs et des routeurs pas un ingénieur (quelques modifications mineurs). J’ai également regardé les syslog et l’observateur d’évènements sur ces machines.
 
Ces problèmes sont fréquents et ne correspondent à aucun changement dans le réseau d’entreprise. Les modifications du switch et la lecture des logs n’ont pas été concluant. De plus, les troubles persistent et je n’ai pas la délégation pour transmettre les configurations et les logs.  
 
Je suis à court d’idées. Auriez-vous des solutions de test me permettant de mettre en lumière ces problèmes.  
Merci pour l’attention que vous portez à ma demande.

Reply

Marsh Posté le 11-04-2012 à 11:32:28   

Reply

Marsh Posté le 11-04-2012 à 12:27:42    

C'est tout de meme tres etrange, le ping prend du delay sans lien entre les VMs, alors que le flux reseau passe sur la meme interface physique non ?
 
Tu as essaye de down deux des trois interfaces de tes VMs et de continuer l'observation pour voir ce qui arrive ? (si tu peux te le permettre)

Reply

Marsh Posté le 11-04-2012 à 14:10:17    

Concernant la hausse sur les machines hôtes, ce sont des tests réalisés avec Iperf. Si cette hausse n’est pas visible sur les VM, c’est parce que l’échelle est trop grande pour les observer (41ms pour les hotes contre 8000ms sur les VM).
 
édit : Je vais trouver un créneau avec les utilisateurs pour couper alternativement les serveurs et observer les résultats.


Message édité par isaac76 le 11-04-2012 à 18:16:55
Reply

Marsh Posté le 13-04-2012 à 10:18:23    


Bon je n'ais pas pu isoler tous les serveur un à un. J'ai pu en redémarrer deux. Au premier abord rien a signaler mais en regardant de plus près on pense avoir trouvé. Je suis confiant, j'attend les résultats des tests lundi.  
 
Je reviendrais éditer ce poste quand j'en saurait un peu plus.

Reply

Marsh Posté le 18-04-2012 à 09:15:12    

J'ai poussé les recherches sur ces serveur.
Après avoir diagnostiqué un problème réseau, il s'avère que c'est un problème système.  
 
Quand on travail sur les machines virtuelles incriminé, on s’aperçoit qu'elles se figent (linux & windows). L'horloge rattrape le temps perdu sous NTP ou se décale selon les cas. Il n'y a aucune erreur système dans les logs (ce qui faisait penser à une erreur réseau). Les machines sont en sommeil.  
 
J'ai pensé à un problème de ressources processeur. Après vérification aucune priorité sur les machines n'est paramétré. Fait troublant, ce sont toujours les même machines qui sont touchées.  
Avez vous des idées ?
 
Je suis conscient que ce topic n'est plus adapté à la section. Je le clôturerais dans la semaine si rien de plus n'est apporté.


Message édité par isaac76 le 18-04-2012 à 11:56:12
Reply

Marsh Posté le 18-04-2012 à 13:01:21    

bonjour issac76,
 
Peux-tu nous en dire un peu plus sur la latence et/ou le débit des disques de tes serveurs hôtes (ESX?) observés sur une même période ?
 

Reply

Marsh Posté le 18-04-2012 à 14:09:54    


sur les machines hotes :
Je ne pense pas que cela vienne des disques, les moniteurs ne plafonnent pas sur les débits des disques. Il en est de même pour les autres caractéristiques techniques. De plus, les VM sont totalement absentes lors des freezes. Les programme en mémoire tel que l'horloge (ou autre) devraient toujours tourner en théorie. non ?
 
Ces points me font penser que cela ne vient pas des disques.

Reply

Marsh Posté le 08-06-2012 à 14:24:17    

Je me demande si ca ne vient pas d'autre chose, j'ai eu le même problème sous windows 2008 R2 sur un environnement virtuel (3 hosts ESXi 8Cores/128Go/SSD/15k) avec deux HP left-hand de 6To en iSCSI (en 15k 600Go), je ne pense pas que ce soit un probleme de perf. Surtout que ca le fait que sur celle ci.

Reply

Marsh Posté le 09-06-2012 à 18:45:43    

J'avais eu des problèmes similaires de freezes de VM, au final c'était du au storage dans tous les cas (une fois, un datastore qui avait été supprimé du filer mais pas de ESX, donc freeze toutes les 30 minutes lors du scan des datastores, et d'autres fois des freezes temporaires des I/O sur les filers).

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed