probleme incomprehensible avec Heartbeat

probleme incomprehensible avec Heartbeat - Logiciels - Linux et OS Alternatifs

Marsh Posté le 19-08-2004 à 00:02:55    

Salut,
 
J ai il y a quelque temps migré un de mes server vers debian, et je n arrive pas mettre en place Heartbeat 1.3.0 sur ce serveur.
(http://forum.hardware.fr/hardwarefr/OSAlternatifs/sujet-40301-1.htm)
 
l autre serveur est un RedHat Heartbeat 1.3.0 et normallement tout marche bien sur celui la.
 

Code :
  1. ha.cf:
  2. debugfile /var/log/ha-debug
  3. logfile /var/log/ha-log
  4. logfacility     local0
  5. deadtime 15
  6. keepalive 2
  7. warntime 15
  8. initdead 30
  9. ucast   eth0    10.105.193.86
  10. auto_failback   on
  11. node    proxy1.eu.domain.com
  12. node    proxy2.eu.domain.com


 

/etc/ha.d/haresources
proxy1.eu.domain.com 10.105.193.55
proxy2.eu.domain.com 10.105.193.56


 
 

Code :
  1. Log :
  2. proxy1:~# tail -f /var/log/ha-log
  3. heartbeat: 2004/08/18_23:54:09 info: **************************
  4. heartbeat: 2004/08/18_23:54:09 info: Configuration validated. Starting heartbeat 1.3.0
  5. heartbeat: 2004/08/18_23:54:09 info: heartbeat: version 1.3.0
  6. heartbeat: 2004/08/18_23:54:09 info: Heartbeat generation: 37
  7. heartbeat: 2004/08/18_23:54:09 info: ucast: write socket priority set to IPTOS_LOWDELAY on eth0
  8. heartbeat: 2004/08/18_23:54:09 info: ucast: bound send socket to device: eth0
  9. heartbeat: 2004/08/18_23:54:09 info: ucast: bound receive socket to device: eth0
  10. heartbeat: 2004/08/18_23:54:09 info: ucast: started on port 694 interface eth0 to 10.105.193.86
  11. heartbeat: 2004/08/18_23:54:09 info: pid 9674 locked in memory.
  12. heartbeat: 2004/08/18_23:54:09 info: Local status now set to: 'up'
  13. heartbeat: 2004/08/18_23:54:10 info: pid 9677 locked in memory.
  14. heartbeat: 2004/08/18_23:54:10 info: pid 9678 locked in memory.
  15. heartbeat: 2004/08/18_23:54:10 info: pid 9679 locked in memory.
  16. heartbeat: 2004/08/18_23:54:11 info: Link proxy2.eu.domain.com:eth0 up.
  17. heartbeat: 2004/08/18_23:54:11 info: Status update for node proxy2.eu.domain.com: status active
  18. heartbeat: 2004/08/18_23:54:11 info: Local status now set to: 'active'
  19. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  20. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  21. heartbeat: 2004/08/18_23:54:11 info: Local Resource acquisition completed. (none)
  22. heartbeat: 2004/08/18_23:54:11 info: proxy2.eu.domain.com wants to go standby [foreign]
  23. heartbeat: 2004/08/18_23:54:11 info: Running /etc/ha.d/rc.d/status status
  24. heartbeat: 2004/08/18_23:54:11 info: standby: acquire [foreign] resources from proxy2.eu.domain.com
  25. heartbeat: 2004/08/18_23:54:11 info: acquire local HA resources (standby).
  26. heartbeat: 2004/08/18_23:54:11 info: Acquiring resource group: proxy1.eu.domain.com 10.105.193.55
  27. starteat: 2004/08/18_23:54:11 info: Running /etc/ha.d/resource.d/IPaddr 10.105.193.55
  28. heartbeat: 2004/08/18_23:54:11 ERROR: unable to find an interface for 10.105.193.55
  29. heartbeat: 2004/08/18_23:54:11 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr
  30.   returned 2564/08/18_23:54:11 ERROR: /usr/lib/heartbeat/ResourceManager takegroup 10.105.193.55
  31. heartbeat: 2004/08/18_23:54:11 info: local HA resource acquisition completed (standby).
  32. heartbeat: 2004/08/18_23:54:11 info: Standby resource acquisition done [foreign].
  33. heartbeat: 2004/08/18_23:54:11 info: Initial resource acquisition complete (auto_failback)
  34. heartbeat: 2004/08/18_23:54:11 info: remote resource transition completed.
  35. heartbeat: 2004/08/18_23:54:17 info: Heartbeat shutdown in progress. (9674)
  36. heartbeat: 2004/08/18_23:54:17 info: Giving up all HA resources.
  37. heartbeat: 2004/08/18_23:54:18 info: Releasing resource group: proxy1.eu.domain.com 10.105.193.55
  38. stopbeat: 2004/08/18_23:54:18 info: Running /etc/ha.d/resource.d/IPaddr 10.105.193.55
  39. probably not LSB-compliant.18 WARN: Resource script for 10.105.193.55
  40. ) MUST succeed on a stop when already stopped05.193.55
  41. heartbeat: 2004/08/18_23:54:18 WARN: Machine reboot narrowly avoided!
  42. heartbeat: 2004/08/18_23:54:18 info: Releasing resource group: proxy2.eu.domain.com 10.105.193.56
  43. stopbeat: 2004/08/18_23:54:18 info: Running /etc/ha.d/resource.d/IPaddr 10.105.193.56
  44. probably not LSB-compliant.18 WARN: Resource script for 10.105.193.56
  45. ) MUST succeed on a stop when already stopped05.193.56
  46. heartbeat: 2004/08/18_23:54:18 WARN: Machine reboot narrowly avoided!
  47. heartbeat: 2004/08/18_23:54:18 info: All HA resources relinquished.
  48. heartbeat: 2004/08/18_23:54:19 info: killing HBFIFO process 9677 with signal 15
  49. heartbeat: 2004/08/18_23:54:19 info: killing HBWRITE process 9678 with signal 15
  50. heartbeat: 2004/08/18_23:54:19 info: killing HBREAD process 9679 with signal 15
  51. heartbeat: 2004/08/18_23:54:19 info: Core process 9678 exited. 3 remaining
  52. heartbeat: 2004/08/18_23:54:19 info: Core process 9677 exited. 2 remaining
  53. heartbeat: 2004/08/18_23:54:19 info: Core process 9679 exited. 1 remaining
  54. heartbeat: 2004/08/18_23:54:19 info: Heartbeat shutdown complete.


 
 
Il y a donc 3 erreurs que je n arrive pas a supprimer.
 
Merci de votre aide


Message édité par Z_cool le 20-08-2004 à 08:38:25

---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 00:02:55   

Reply

Marsh Posté le 19-08-2004 à 09:51:43    

Bouuuuh personne ?


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 13:38:10    

Help.
 
 
ca fait maintenant 2 semaine que mon serveur est plus en prod a cause de ce heartbeat


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 13:44:47    

J'ai pas de solution cette fois, mais comme t'as du le voir dans les logs  le probleme ce situe au niveau du script /etc/ha.d/resource.d/IPaddr qui n'arrive pas attribuer la nouvelle adresse IP à la machine.
Tu peux jeter un oeil dans ce script voir ce qu'il fait exactement (quelles commandes il apelle) pour voir ou ca bloque, ou sinon poste sur la mailling list de heartbeat, c'est là que tu as le plus de chances de trouver de l'aide.
 
Mais à priori c'est pas un problème de conf.

Reply

Marsh Posté le 19-08-2004 à 14:35:46    

J ai demandé une inscription a la mailing liste, mais pour l instant je n ai rien recu  :sweat:


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 14:52:30    

touhhhh !
 
 
j ai une autre debian sous la main (plutot sous MS Virtual PC) et exactement le meme resultat.


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 15:16:09    

tien, sur ma config de test, j ai lancé une fois a la main IPadd, ca a marché.  
 
et maintenant, heartbeat march bien....  :heink:


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 15:56:32    

T'as rien /var/log/messages au momemt ou les basculements ne fonctionnaient pas ?

Reply

Marsh Posté le 19-08-2004 à 17:46:44    

Shyamalan a écrit :

T'as rien /var/log/messages au momemt ou les basculements ne fonctionnaient pas ?


 
j ai pas fait gaffe.
 
 
apres essai, IPaddr a bien marché aussi sur mon serveur en attente de prod.
 
mais avec une IP ki n est pas interessante.
 
bon, je retenterais cette nuit un bascullement


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 21:25:42    

puré, je comprend rien de rien de  rien :
 
je lance heartbeat sur debian. j ai l erreur
je lance a la main IPaddr, il me prend bien l IP
j arrete IPaddr a la main
j arrete heartbeat  
et l autre machine reprend l IP comme elle ce doit.
 
elle fait vraiment chier sur ce coup la la debian


---------------
#mais-chut
Reply

Marsh Posté le 19-08-2004 à 21:25:42   

Reply

Marsh Posté le 19-08-2004 à 21:45:53    

Bon ba voila que ca marche.
 
 
 
en desepoire de cause, et surtout a cause de :  
 

Citation :

probably not LSB-compliant.18 WARN: Resource script for 10.105.193.55
  ) MUST succeed on a stop when already stopped05.193.55


 
j ai effacé integrallement mon fichier haresources et je l ai resaisi integralement et voila, c est tout bon
 
ce fichier etait passé au travers d un WAN, d edition sous Windows et autre. je me suis donc dit que peutr etre un caractere non affichable s etait glisser dedans


---------------
#mais-chut
Reply

Marsh Posté le 24-08-2004 à 11:23:44    

bon decidement ca marche pas terrible Heartbeat, et ca commence serieusement a me gaver.
 


---------------
#mais-chut
Reply

Marsh Posté le 24-08-2004 à 12:35:35    

c'est quoi le problème cette fois ?
 
chez nous ca tourne en prod sans aucun probleme (mais pas en 1.3)  [:spamafote]

Reply

Marsh Posté le 24-08-2004 à 13:23:10    

Salut
 
Je sais pas si c'est en relation avec ton problème mais la version 1.3.0 est une version beta.
 
Essaye avec la 1.2.2.
 
Je tourne avec cette version 1.2.2 et je n'ai aucun des problème que tu rencontres.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed