probleme incomprehensible avec Heartbeat

probleme incomprehensible avec Heartbeat - Logiciels - Linux et OS Alternatifs

Marsh Posté le 19-08-2004 à 00:02:55    

J ai il y a quelque temps migré un de mes server vers debian, et je n arrive pas mettre en place Heartbeat 1.3.0 sur ce serveur.
l autre serveur est un RedHat Heartbeat 1.3.0 et normallement tout marche bien sur celui la.

Code :
  2. debugfile /var/log/ha-debug
  3. logfile /var/log/ha-log
  4. logfacility     local0
  5. deadtime 15
  6. keepalive 2
  7. warntime 15
  8. initdead 30
  9. ucast   eth0
  10. auto_failback   on
  11. node
  12. node




Code :
  1. Log :
  2. proxy1:~# tail -f /var/log/ha-log
  3. heartbeat: 2004/08/18_23:54:09 info: **************************
  4. heartbeat: 2004/08/18_23:54:09 info: Configuration validated. Starting heartbeat 1.3.0
  5. heartbeat: 2004/08/18_23:54:09 info: heartbeat: version 1.3.0
  6. heartbeat: 2004/08/18_23:54:09 info: Heartbeat generation: 37
  7. heartbeat: 2004/08/18_23:54:09 info: ucast: write socket priority set to IPTOS_LOWDELAY on eth0
  8. heartbeat: 2004/08/18_23:54:09 info: ucast: bound send socket to device: eth0
  9. heartbeat: 2004/08/18_23:54:09 info: ucast: bound receive socket to device: eth0
  10. heartbeat: 2004/08/18_23:54:09 info: ucast: started on port 694 interface eth0 to
  11. heartbeat: 2004/08/18_23:54:09 info: pid 9674 locked in memory.
  12. heartbeat: 2004/08/18_23:54:09 info: Local status now set to: 'up'
  13. heartbeat: 2004/08/18_23:54:10 info: pid 9677 locked in memory.
  14. heartbeat: 2004/08/18_23:54:10 info: pid 9678 locked in memory.
  15. heartbeat: 2004/08/18_23:54:10 info: pid 9679 locked in memory.
  16. heartbeat: 2004/08/18_23:54:11 info: Link up.
  17. heartbeat: 2004/08/18_23:54:11 info: Status update for node status active
  18. heartbeat: 2004/08/18_23:54:11 info: Local status now set to: 'active'
  19. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  20. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  21. heartbeat: 2004/08/18_23:54:11 info: Local Resource acquisition completed. (none)
  22. heartbeat: 2004/08/18_23:54:11 info: wants to go standby [foreign]
  23. heartbeat: 2004/08/18_23:54:11 info: Running /etc/ha.d/rc.d/status status
  24. heartbeat: 2004/08/18_23:54:11 info: standby: acquire [foreign] resources from
  25. heartbeat: 2004/08/18_23:54:11 info: acquire local HA resources (standby).
  26. heartbeat: 2004/08/18_23:54:11 info: Acquiring resource group:
  27. starteat: 2004/08/18_23:54:11 info: Running /etc/ha.d/resource.d/IPaddr
  28. heartbeat: 2004/08/18_23:54:11 ERROR: unable to find an interface for
  29. heartbeat: 2004/08/18_23:54:11 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr
  30.   returned 2564/08/18_23:54:11 ERROR: /usr/lib/heartbeat/ResourceManager takegroup
  31. heartbeat: 2004/08/18_23:54:11 info: local HA resource acquisition completed (standby).
  32. heartbeat: 2004/08/18_23:54:11 info: Standby resource acquisition done [foreign].
  33. heartbeat: 2004/08/18_23:54:11 info: Initial resource acquisition complete (auto_failback)
  34. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  35. heartbeat: 2004/08/18_23:54:17 info: Heartbeat shutdown in progress. (9674)
  36. heartbeat: 2004/08/18_23:54:17 info: Giving up all HA resources.
  37. heartbeat: 2004/08/18_23:54:18 info: Releasing resource group:
  38. stopbeat: 2004/08/18_23:54:18 info: Running /etc/ha.d/resource.d/IPaddr
  39. probably not LSB-compliant.18 WARN: Resource script for
  40. ) MUST succeed on a stop when already stopped05.193.55
  41. heartbeat: 2004/08/18_23:54:18 WARN: Machine reboot narrowly avoided!
  42. heartbeat: 2004/08/18_23:54:18 info: Releasing resource group:
  43. stopbeat: 2004/08/18_23:54:18 info: Running /etc/ha.d/resource.d/IPaddr
  44. probably not LSB-compliant.18 WARN: Resource script for
  45. ) MUST succeed on a stop when already stopped05.193.56
  46. heartbeat: 2004/08/18_23:54:18 WARN: Machine reboot narrowly avoided!
  47. heartbeat: 2004/08/18_23:54:18 info: All HA resources relinquished.
  48. heartbeat: 2004/08/18_23:54:19 info: killing HBFIFO process 9677 with signal 15
  49. heartbeat: 2004/08/18_23:54:19 info: killing HBWRITE process 9678 with signal 15
  50. heartbeat: 2004/08/18_23:54:19 info: killing HBREAD process 9679 with signal 15
  51. heartbeat: 2004/08/18_23:54:19 info: Core process 9678 exited. 3 remaining
  52. heartbeat: 2004/08/18_23:54:19 info: Core process 9677 exited. 2 remaining
  53. heartbeat: 2004/08/18_23:54:19 info: Core process 9679 exited. 1 remaining
  54. heartbeat: 2004/08/18_23:54:19 info: Heartbeat shutdown complete.

Il y a donc 3 erreurs que je n arrive pas a supprimer.
Merci de votre aide

Message édité par Z_cool le 20-08-2004 à 08:38:25


Marsh Posté le 19-08-2004 à 00:02:55   


Marsh Posté le 19-08-2004 à 09:51:43    

Bouuuuh personne ?


Marsh Posté le 19-08-2004 à 13:38:10    

ca fait maintenant 2 semaine que mon serveur est plus en prod a cause de ce heartbeat


Marsh Posté le 19-08-2004 à 13:44:47    

J'ai pas de solution cette fois, mais comme t'as du le voir dans les logs  le probleme ce situe au niveau du script /etc/ha.d/resource.d/IPaddr qui n'arrive pas attribuer la nouvelle adresse IP à la machine.
Tu peux jeter un oeil dans ce script voir ce qu'il fait exactement (quelles commandes il apelle) pour voir ou ca bloque, ou sinon poste sur la mailling list de heartbeat, c'est là que tu as le plus de chances de trouver de l'aide.
Mais à priori c'est pas un problème de conf.


Marsh Posté le 19-08-2004 à 14:35:46    

J ai demandé une inscription a la mailing liste, mais pour l instant je n ai rien recu  :sweat:


Marsh Posté le 19-08-2004 à 14:52:30    

touhhhh !
j ai une autre debian sous la main (plutot sous MS Virtual PC) et exactement le meme resultat.


Marsh Posté le 19-08-2004 à 15:16:09    

tien, sur ma config de test, j ai lancé une fois a la main IPadd, ca a marché.  
et maintenant, heartbeat march bien....  :heink:


Marsh Posté le 19-08-2004 à 15:56:32    

T'as rien /var/log/messages au momemt ou les basculements ne fonctionnaient pas ?


Marsh Posté le 19-08-2004 à 17:46:44    

Shyamalan a écrit :

T'as rien /var/log/messages au momemt ou les basculements ne fonctionnaient pas ?

j ai pas fait gaffe.
apres essai, IPaddr a bien marché aussi sur mon serveur en attente de prod.
mais avec une IP ki n est pas interessante.
bon, je retenterais cette nuit un bascullement


Marsh Posté le 19-08-2004 à 21:25:42    

puré, je comprend rien de rien de  rien :
je lance heartbeat sur debian. j ai l erreur
je lance a la main IPaddr, il me prend bien l IP
j arrete IPaddr a la main
j arrete heartbeat  
et l autre machine reprend l IP comme elle ce doit.
elle fait vraiment chier sur ce coup la la debian


Marsh Posté le 19-08-2004 à 21:25:42   


Marsh Posté le 19-08-2004 à 21:45:53    

Bon ba voila que ca marche.
en desepoire de cause, et surtout a cause de :  

Citation :

probably not LSB-compliant.18 WARN: Resource script for
  ) MUST succeed on a stop when already stopped05.193.55

j ai effacé integrallement mon fichier haresources et je l ai resaisi integralement et voila, c est tout bon
ce fichier etait passé au travers d un WAN, d edition sous Windows et autre. je me suis donc dit que peutr etre un caractere non affichable s etait glisser dedans


Marsh Posté le 24-08-2004 à 11:23:44    

bon decidement ca marche pas terrible Heartbeat, et ca commence serieusement a me gaver.


Marsh Posté le 24-08-2004 à 12:35:35    

c'est quoi le problème cette fois ?
chez nous ca tourne en prod sans aucun probleme (mais pas en 1.3)  [:spamafote]


Marsh Posté le 24-08-2004 à 13:23:10    

Je sais pas si c'est en relation avec ton problème mais la version 1.3.0 est une version beta.
Essaye avec la 1.2.2.
Je tourne avec cette version 1.2.2 et je n'ai aucun des problème que tu rencontres.


Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed