The present invention describes a method and system for achieving high
availability in a networked computer system. In particular, the method for
achieving high-availability is executed in a networked computer system.
The networked computer system includes nodes connected by a network. The
method includes using high-availability-aware components to represent
hardware and software in the networked computer system, managing the
components to achieve a desired level of redundancy, and monitoring health
of the networked computer system, including health of components and
nodes. The method further includes detecting a failure in the networked
computer system. Failures detected by the method include failures of a
component and/or node. Finally, the method includes recovering from the
failure by performing an appropriate failure recovery procedure.
La présente invention décrit une méthode et un système pour réaliser la disponibilité élevée dans un système informatique géré en réseau. En particulier, la méthode pour réaliser la haut-disponibilité est exécutée dans un système informatique géré en réseau. Le système informatique géré en réseau inclut des noeuds reliés par un réseau. La méthode inclut en utilisant les composants haut-disponibilité-avertis pour représenter le matériel et le logiciel dans le système informatique géré en réseau, parvenant les composants pour réaliser un niveau désiré de redondance, et surveillant la santé du système informatique géré en réseau, y compris la santé des composants et des noeuds. La méthode autre inclut détecter un échec dans le système informatique géré en réseau. Les échecs détectés par la méthode incluent des échecs d'un composant et/ou d'un noeud. En conclusion, la méthode inclut la récupération de l'échec en exécutant une procédure de reprise appropriée d'échec.