[RESOLU] Erreur à répétition quand accès aux partages

Erreur à répétition quand accès aux partages [RESOLU] - Infrastructures serveurs - Systèmes & Réseaux Pro

Marsh Posté le 04-02-2009 à 11:12:14    

Bonjour à tous :)
 
J'aurais besoin d'aide pour un problème sur notre serveur Windows Server 2003 R2 SP2, qui semble en rapport avec l'accès aux données partagées.
 
Ce serveur a été réinstallé (formaté) complètement au mois d’Octobre 2008  et assurent les rôles suivant : serveur de données, serveur hébergeant notre logiciel et nos bases pour un ERP, et serveur de sauvegarde (Acronis True Image Entreprise Server)
 
Notre réseau est composé en majorité de postes Windows (Win XP, Vista) et de quelques MAC (Mac OS X)
 
Depuis début Janvier, et ce sans que le serveur n’ai posé le moindre problème ou subit de modifications sauf les MAJ de sécurité Microsoft, l’observateur d’événements affiche un message d’erreur à répétition dans la section « système », pas des plus explicites au premier abord :
 

 
Source : Srv ; Type : Erreur; Id Evén. : 2000
 
L'appel du serveur à un service système a échoué de façon inattendue.
Pour plus d'informations, consultez le centre Aide et support à l'adresse http://go.microsoft.com/fwlink/events.asp.
 
Mot :
 
0000: 00040000 00540001 00000000 c00007d0
0010: 00000000 c0000054 00000000 00000000
0020: 00000000 00000000 022a0342  
 

 
Ce qui est assez embétant c'est que de temps en temps, le système plante et la machine est inaccessible via le réseau (donc plus de partage), mais répond toujours au ping. On ne peut même plus la manipuler en local, le curseur bouge mais le bureau ne répond plus. Il n'y a pas d'écran bleu ou autre, il faut alors rebooter la machine manuellement.
 
J’ai donc fait pas mal de recherche là-dessus, et j’ai trouvé quelques d’informations, particulièrement sur cette page :
 
 http://www.eventid.net/display.asp [...] rv&phase=1
 
Mais aucune réelle solution ....
 
De plus, J’ai remarqué que ces messages d’erreur ne s’affichent pas en dehors des heures de présence des utilisateurs. C’est donc bien en rapport avec une activité sur le serveur en journée.
 
Il semble également qu’il y ai un rapport avec les quelques MAC que nous avons sur notre réseau. En effet, impossible de faire apparaître le message « sur demande » avec un poste Windows, et le message n’apparait pas du tout en l’absence d’activité des MAC.
 
Sous MAC OS X, les Mac utilisent le protocole SMB pour accéder aux données, comme les machines Windows.
 
J’ai vue que l’une des dernières MAJ critiques de sécurité pour Windows 2K3, et qui a été installé, impliquait justement des modification au niveau du protocole SMB :
 
Microsoft kb958687 : http://www.microsoft.com/technet/s [...] 9-001.mspx
 
Il y a peut-être un lien, mais je n’ai trouvé personne qui avait ce type de problème à la suite de l’installation de cette MAJ pour pouvoir l’affirmer avec certitude.
 
Voilà en gros ou j'en suis, désolé pour le post assez long.
 
Si quelqu'un à une idée, toute aide est la bienvenu :)


Message édité par ptitsonic le 16-03-2009 à 13:59:32
Reply

Marsh Posté le 04-02-2009 à 11:12:14   

Reply

Marsh Posté le 04-02-2009 à 21:14:40    

- bah moi sur eventid je lis ça :
"The relevant information is the actual error code listed in the "Data" portion of the event so don't troubleshoot this just based on the general "
==> t'as quoi toi comme code d'erreur dans la partie "Data" ?
 
- Sinon donc ton 2003 est super à jour ?
 
- Bah au pire t'essai de désinstaller la maj 958687 pour avoir ton 2003 à l'ancienne version de SMB...t'as essayé ?
 
- ya pas d'autres event que le 2000 SRV ?
 
- t'as passé des anti espions dessus ?

Message cité 1 fois
Message édité par akizan le 04-02-2009 à 21:18:17
Reply

Marsh Posté le 05-02-2009 à 00:57:12    

akizan a écrit :


- Sinon donc ton 2003 est super à jour ?
 
Oui avec toutes les dernières MAJ Microsoft via Windows Update
 
- Bah au pire t'essai de désinstaller la maj 958687 pour avoir ton 2003 à l'ancienne version de SMB...t'as essayé ?
 
Pas encore, je peu effectivement la désinstaller, cependant comme il s'agit d'une MAJ critique et qu'il faut redémarrer le système, je n'ai pas encore eu l'occasion de le faire, le serveur est très utilisé de très tot le matin jusque très tard le soir... mais je vais essayer de le faire rapidement histoire d'en avoir le coeur net
 
- ya pas d'autres event que le 2000 SRV ?
 
Non il n'y a que cette erreur qui se répète très souvent dans les conditions que j'ai décrite, sinon RAS. Et la nuit par exemple quand des traitements tournent sur le serveur pour nos bases ERP ou pour les sauvegardes, aucune erreur, c'est seulement en journée, en présence d'utilisateurs, que l'erreur est enregistrée dans l'observateur, à répétition. D'ou le fait que je soupconne un problème en rapport avec le partage des données. Et donc en plus, lorsque j'accède aux données à un instant t avec un poste Windows, quel qu'il soit (XP ou Vista), l'erreur ne se présente jamais dans l'observateur. D'ailleurs exemple parlant, nous avons une permanence le Samedi matin et les utilisateurs présent n'ont que des postes Windows, et se connectent sur l'ERP : jamais aucune erreur dans l'observateur les Samedi matin.
C'est donc logiquement en rapport avec l'accès aux partages et .. les MAC, non ?

 
- t'as passé des anti espions dessus ?
 
Le serveur est protégé par ESET NOD32 Antivirus/Antispyware Business Edition dernière version, et RAS sur les scans avec les dernières bases à jour, je réalise régulièrement des analyses complètes histoire de vérifier, en plus de la protection live
 
- bah moi sur eventid je lis ça :
"The relevant information is the actual error code listed in the "Data" portion of the event so don't troubleshoot this just based on the general "
==> t'as quoi toi comme code d'erreur dans la partie "Data" ?
 
Pour ça, je verrais demain ce que je peu trouver :), merci pour ces pistes en tout cas


Message édité par ptitsonic le 05-02-2009 à 01:17:32
Reply

Marsh Posté le 05-02-2009 à 07:46:55    

Tu peux programmer un redémarrage de ton serveur avec une tache planifiée qui lance un "shutdown -r -f -t 0"

Reply

Marsh Posté le 05-02-2009 à 17:27:10    

ouaip mais c'est toujours chaud ça :(
perso j'aime pas trop le faire....

Reply

Marsh Posté le 11-02-2009 à 18:57:47    

Bonjour et merci pour ces quelques réponses.

 

Je n'ai pas eu l'occasion, malheureusement, de redémarrer le serveur pour faire quelques tests plus poussés.

 

Cependant je peu maintenant affirmer avec une totale certitude que les erreurs viennent des accès des MAC, nous avons fait des vérifications en ce sens, et nous en avons eu la preuve formelle.

 

Reste à trouver pourquoi et comment y remédier.


Message édité par ptitsonic le 11-02-2009 à 18:58:09
Reply

Marsh Posté le 16-02-2009 à 09:50:37    

Bonjour a tous,
 
J'ai eu l'occasion de redémarrer le serveur et faire quelques tests.
 
J'ai d'abord désinstallé le logiciel de sauvegarde afin de savoir s'il était concerné ou non par le problème.
 
Après redémarrage du serveur, j'ai testé un accès avec un Mac, et idem l'erreur est également présente au niveau de l'observateur. Il y a donc bien quelque chose avec une MAJ Windows récente, puisque pour rappel le serveur n'a subit aucune modification majeur sauf des MAJ de sécurité et fonctionnait impec depuis le mois d'octobre 2008.
 
J'ai ensuite réinstaller le logiciel de sauvegarde et nouveau reboot. Et là surprise ! certains partages ne fonctionnaient plus ! nous avons un stockage externe en USB (temporaire) et les partages sur ce dernier n'étaient tout simplement pas visible via le réseau, alors qu'ils sont bien activés au niveau du serveur !
 
Après une petite recherche, j'ai trouvé une solution qui consiste à ajouter une clé registre "IRPStackSize" et d'en fixer la valeur.
 
Après ajout de la clé et reboot, les partages étaient de nouveaux visibles, mais pourquoi aurais-je maintenant besoin de cette clé registre pour que cela fonctionne ! une MAJ Windows récente aurait modifié quelque chose et provoqué une sorte d'incompatibilité avec le soft de sauvegarde (qui est sur sa dernière version) ? puisque pour rappel, ce soft est lui aussi installé depuis le mois d'Octobre et n'a jamais posé le moindre problème, le serveur ayant été occasionnellement redémarré durant cette période, notamment justement pour les MAJ de sécurité.
 
J'ai ensuite refais le test d'accès avec un Mac, et je me suis apperçu que les erreurs ne se manifestaient que lorsque j'accédais justement à ce périphérique USB ! et non lorsque j'accédais aux données stockés sur le disque interne du serveur.
 
Voilà les avancées, mais déjà je pense contacter le support Acronis pour leur demander des explications sur ce phénomène de blocage des partages, car je sais que leur soft installe un périphérique de réseau virtuel ...


Message édité par ptitsonic le 16-02-2009 à 09:52:37
Reply

Marsh Posté le 17-02-2009 à 17:42:09    

ohhh bah bien joué dis dont !
t'as du y passer du temps sur ce truc !!!
Pour info, IRPStacksize, tu sais à quoi ça sert ?
la valeur par défaut est de combien ? et toi tu as mis combien ?
++

Reply

Marsh Posté le 18-02-2009 à 17:58:36    

Pas tant de temps que ça ... surtout parce que je n'en dispose pas de beaucoup :(, bien d'autres rôles à assurer en même temps dans mon entreprise.
 
Pour l'IRPStackSize, en voici l'influence :
 
http://support.microsoft.com/kb/285089/fr
 
Le paramètre IRPStackSize spécifie le nombre d'emplacements de pile dans les paquets de demandes d'E/S qui sont utilisés par Windows 2000 Server et par Windows Server 2003. Vous devrez peut-être augmenter ce nombre pour certains transports, pour les pilotes MAC (Media Access Control), ou pour les pilotes de système de fichiers. Chaque pile utilise 36 octets de mémoire pour chaque tampon de réception.
 
Par défaut, la valeur sous Win2K et Win2K3 est de 15, mais la clé n'existe pas dans le registre. Le fait de la créer permet d'influer sur ce paramètre.
 
Perso je l'ai fixé à 50, soit la valeur maximum acceptée par le système. Néamoins, cela n'a pas résolu pour autant mon problème.


Message édité par ptitsonic le 19-02-2009 à 01:08:00
Reply

Marsh Posté le 16-03-2009 à 13:58:23    

Bonjour,
 
Pour info le problème a été réglé implicitement en .... migrant tout le parc des machine sur de nouveaux serveurs et un nouveau domaine Windows (bien sûre il y avait d'autres raisons qui le justifiait)
 
Cependant, le cas avait bien été isolé, le problème ne s'est présenté qu'après les MAJ Windows de Janvier qui m'ont obligé à faire la modif de l'IRPStackSize pour faire fonctionner Acronis (qui marchait très bien avant), et ne se produisait que sur des accès au disque dur externe USB, sur les disques internes du serveur, aucun problème.
 
Aujourd'hui sur nos serveurs tout frais et le nouveau domaine, plus aucun problème de ce type pour aucune machine, Mac compris.
 
Merci en tout cas à ceux qui m'ont apporté leur aide.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed