Exchange 2007 : fichiers temporaires qui font exploser les I/O

Exchange 2007 : fichiers temporaires qui font exploser les I/O - Logiciels d'entreprise - Systèmes & Réseaux Pro

Marsh Posté le 21-03-2011 à 15:22:42    

Salut, j'ai un soucis tres lourdingue depuis quelques jours sur un de mes serveurs Exchange 2007 (SP3 UR3, sur un 2k3 SP2, le système et les logs sur une pile raid1, les bdd sur une pile raid5, tout sur des disques SAS 15k, il fait BAL+CAS+HUB).
 
Sans que j'ai pour le moment identifié de cause particulère, store.exe se met a intervalles variables à créer des fichiers ifs*.tmp dans windows\temp, et ce de façon ultra-brutale : ces fichiers peuvent rapidement prendre plusieurs Go, et les opérations de lecture/ecriture dessus saturent tres rapidement les I/O des disques de la pile système au point de faire totalement ramer tout le serveur. Soit le problème disparait de lui même au bout de quelques heures, soit il faut que je démonte manuellement ma banque de BAL : on voit alors les fichiers temp qui se sont accumulés disparaitre 1 par 1, jusqu'à ce qu'ils aient été tous traités, ce qui peut prendre pas loin d'une heure avant que la banque soit proprement démontée. Le serveur va ensuite tourner normalement un certain temps, avant que le problème réaparraisse.
 
Y'a eu aucun changement de config ou de passage de patch au moment de l'apparition du problème, je n'ai rien de spécial dans les logs meme en augmentant leur niveau de détail, des reboots des services exchange et du serveur n'ont rien amélioré, et mes recherche sur le problème n'ont rien donné (j'ai vu des trucs parlant de problème avec des AV en mode fichier sur le serveur, mais je n'en ai pas sur celui-la). La maintenance sur la base de BAL se fait toujours bien, le backup et la purge des logs aussi, le BPA ne remonte rien de sérieux et à part les perfs fortement dégradées y'a aucun autre symptome. J'ai un 2ème serveur avec une config identique et une charge et des tailles de bases similaires qui ne recontre aucun problème.
 
J'ai ouvert un case auprès du support MS auquel j'ai droit mais apres les bottages en touches habituels ("oui oui, faut absolument que vous mettiez à jour le firmware des cartes réseaux avant qu'on aille plus loin dans le diagnotisc" ) ils sont toujours dans le flou et à me proposer des solutions completement hors-sujet ("faut couper les pst en petits morceaux sur les postes" [:bien]) : bref, si ça vous parle ou si vous avez la moindre idée sur comment analyser ce soucis, merci de m'aider :jap:


Message édité par El Pollo Diablo le 21-03-2011 à 15:50:16
Reply

Marsh Posté le 21-03-2011 à 15:22:42   

Reply

Marsh Posté le 21-03-2011 à 17:10:43    

Aucune idée.
Perso j'excluerai de l'AV et du backup le répertoire temp et les fichiers edb/stm/log.
 
Je regarderai quels process ont les fichiers stm et tmp ouverts (process explorer voir monitor)

Reply

Marsh Posté le 21-03-2011 à 17:23:47    

Y'a pas d'AV fichier sur le serveur, et le problème peut apparaitre alors que le backup s'est fini proprement depuis belle lurette.
Sinon y'a plus de stm avec exchange 2007, et je ne vois rien d'autre que store.exe qui touche a ces tmp, aux logs exchange et aux edb.

Reply

Marsh Posté le 21-03-2011 à 17:26:22    

Et les compteurs de perf sur les disques d'edb/logs sont bons ou surchargés ? (peut être qu'il crée les fichiers tmp parce que les autres spindles sont au taquet).
 
Tes bases sont grosses ?
Tu as fais un check des db ?

Reply

Marsh Posté le 21-03-2011 à 17:39:22    

Les i/o sont faibles en permanence sur les disques avec les edb. Les logs étant sur le disque systeme et donc le meme que mon windows\temp les compteurs s'affolent quand store.exe commence à lire et ecrire ces fichiers, mais pas avant, et un procmon montre bien que les opérations disques se font quasi exclusivement sur ces fichiers temps et pas sur les logs. Le volume des ces fichiers temps est en plus très largement supérieur au volume de mails échangés ou aux modifs que les users peuvent faire sur leurs BAL.
Un check des db n'a rien donné, mais oui les bases sont grosses (plus de 200Go :o), mais bon y'a pas eu d'explosion particulière de la taille ces derniers temps et j'ai un autre serveur avec une conf indentique et des bases au moins aussi grosses qui ne rencontre pas de problème. Maintenant je migrerais/fractionnerais bien ces bases pour être sur, mais le problème rend le moindre move mailbox interminable (ce matin j'ai coupé au bout de 5 heures le déplacement d'une boite de test de 500ko et 10 mails [:bien] ).


Message édité par El Pollo Diablo le 21-03-2011 à 17:40:32
Reply

Marsh Posté le 21-03-2011 à 17:58:27    

Aucune idée alors :/
 
Va falloir que tu passes la première étape du support technique ms :/ vous avez un contrat premier j'espère :/

Reply

Marsh Posté le 21-03-2011 à 18:06:21    

On a juste des incidents gratos avec notre contrat de licence en volume, c'est mieux que rien ou que de devoir sortir la CB mais t'a aucun engagement sur rien.

Reply

Marsh Posté le 22-03-2011 à 01:57:18    

t'aurais pas un disque dans une de tes piles raid qui part en cacahouetes et qui fait crouter le store.exe, resultat pr eviter de crasher comme une daube il stocke en tmp le temps de traiter les erreurs causé par le disque, donc charge cpu a bloque d'un coté et ecriture disque a donf pr faire waiter la chaine le temps que l'erreur soit corrigé ??
 
ou alors un spam massif qui fait saturer ton cpu donc le store.exe stock en attendant d'avoir une dispo cpu...
 
c'est des idees comme ça.


---------------
LastFm
Reply

Marsh Posté le 22-03-2011 à 10:30:05    

Merci, mais pas de soucis de manque de CPU ou de RAM sur le serveur, le RAID et les disques sont testés et OK, et le serveur est derriere un relais filtrant qui n'a aucun soucis ni explosion de trafic, donc pas de problème de spam ou autre.

Reply

Marsh Posté le 22-03-2011 à 11:40:02    

J'ai a priori trouvé la cause du problème, ça donne envie de pleurer... Il y a quelques mois un user a semble-t-il essayé d'envoyer un mail avec une PJ de 850Mo (oui oui...), ça aurait pu juste l'envoyer bouler mais cet user est sous Mac et utilisait à l'époque le catastrophique Entourage 2008 : quelque chose a visiblement foiré côté client et il s'est retrouvé avec plus de 50 copies de ce mail dans ses brouillons en local.
Ca aurait pu rester comme ça longtemps en bouffant de l'espace sur son disque local pour rien mais sans poser plus de problème que ça, sauf qu'il y a quelques jours on a migré cet user sous Outlook 2011, juste avant que le problème apparaisse : cette nouvelle version a vu ses brouillons uniquement en local et s'est dit que ce serait vachement mieux de les synchroniser sur le serveur, et mes fichiers temp étaient ces plus de 40Go de mails qui arrivait d'un coup sur le coin de la gueule de mon Exchange et qui le saturait completement [:bien]

Reply

Marsh Posté le 22-03-2011 à 11:40:02   

Reply

Marsh Posté le 22-03-2011 à 11:50:26    

Mwahahaha excellent ! J'espère que c'est vraiment ça mais j'avoue c'est énorme !

Reply

Marsh Posté le 22-03-2011 à 18:10:31    

bah oui tu penses que c'est enorme, 50 x 850Mo! :o

 

:D


Message édité par neodam le 22-03-2011 à 18:10:41

---------------
LastFm
Reply

Marsh Posté le 22-03-2011 à 19:10:47    

Pour les malheureux encore forcé d'avoir Entourage, le bug qui fout les gros mails en brouillon semble être celui-la : http://support.microsoft.com/kb/935848
Ce qui voudrait bien dire que mon user aurait essayé d'envoyer 50 fois son mail, et qu'il ne s'est pas inquiété d'avoir 50x un message d'erreur [:bien]


Message édité par El Pollo Diablo le 22-03-2011 à 19:11:21
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed