A method for maintaining a predefined acceptable fault tolerance level for
a plurality of software modules implementing a software program running on
a first plurality of computers coupled together in a cluster configuration
in a first cluster in a clustered computer system. The first plurality of
computers being coupled to a first intelligent director agent. The method
includes tracking, using the first intelligent director agent, status of
the software modules running on the first plurality of computers. The
method also includes ascertaining a fault tolerance level associated with
the software program, with the ascertaining being ascertained by examining
the status of the software modules running on the first plurality of
computers. If the fault tolerance level is below the predefined acceptable
fault tolerance level, the method also includes searching for a first
suitable computer among the first plurality of computers to load another
module of the software program thereon. The first suitable computer
represents a computer of the first plurality of computers that does not
have a module of the software program running thereon. The first suitable
computer is compatible to execute the another copy of the computer
program. If the first suitable computer is available, the method further
includes loading the another module of the software program on the first
suitable computer, registering the first suitable computer as a computer
capable of servicing transaction requests pertaining to the software
program after the another module of the software program is loaded onto
the first suitable computer, and routing the transaction requests
pertaining to the software program to the first suitable computer after
the registering.
Une méthode pour maintenir un niveau acceptable prédéfini de tolérance de fautes pour une pluralité de modules de logiciel mettant en application un logiciel programment le fonctionnement sur une première pluralité d'ordinateurs couplés ensemble dans une configuration de faisceau dans un premier faisceau dans un système informatique groupé. La première pluralité d'ordinateurs étant couplés à un premier agent intelligent de directeur. La méthode inclut le cheminement, en utilisant le premier agent intelligent de directeur, statut des modules de logiciel fonctionnant sur la première pluralité d'ordinateurs. La méthode inclut également s'assurer un niveau de tolérance de fautes lié au programme de logiciel, avec être établi établissant en examinant le statut des modules de logiciel fonctionnant sur la première pluralité d'ordinateurs. Si le niveau de tolérance de fautes est au-dessous du niveau acceptable prédéfini de tolérance de fautes, la méthode inclut également rechercher un premier ordinateur approprié parmi la première pluralité d'ordinateurs pour charger un autre module du programme de logiciel là-dessus. Le premier ordinateur approprié représente un ordinateur de la première pluralité d'ordinateurs qui n'a pas un module du programme de logiciel fonctionnant là-dessus. Le premier ordinateur approprié est compatible pour exécuter l'une autre copie du programme machine. Si le premier ordinateur approprié est disponible, la méthode autre inclut charger l'un autre module du programme de logiciel sur le premier ordinateur approprié, enregistrant le premier ordinateur approprié comme ordinateur capable d'entretenir la transaction demande concerner le programme de logiciel après que l'un autre module du programme de logiciel soit chargé sur le premier ordinateur approprié, et le cheminement la transaction demande concerner le programme de logiciel au premier ordinateur approprié après l'enregistrement.