A distributed computing system includes a number of computers, workstations
or other computing machines interconnected by a network. One or more
service managers are introduced that provide a management interface to
corresponding middleware services. The service manager monitors the
corresponding middleware service, as well as the underlying distributed
computer environment on which an application process that utilizes the
middleware service is executing, and allows the middleware service to
operate more efficiently, in response to run-time environmental
conditions. A fault-tolerance service manager is provided as a management
interface to a fault-tolerance service. The fault-tolerance service
manager monitors the fault-tolerance service, as well as the underlying
distributed computer environment, to make globally optimal decisions,
based on run-time environmental data, and to provide the resulting
information to the fault-tolerance service. The fault-tolerance service
manager can notify the fault-tolerance service about hazardous network
conditions (such as object hosts that may crash soon) and the
fault-tolerance service may decide to migrate application objects or take
other corrective action. The collected environmental data can be used to
determine a health rating of components within the computing environment
which can be utilized, for example, to select an optimal machine for
migration, or to trigger migration or additional replication in the event
the health rating indicates that a failure is expected.
Un système de l'informatique répartie inclut un certain nombre d'ordinateurs, postes de travail ou d'autres machines à calculer reliés ensemble par un réseau. On présente un ou plusieurs directeurs de service qui fournissent une interface de gestion aux services correspondants de logiciel personnalisé. Le directeur de service surveille le service correspondant de logiciel personnalisé, aussi bien que la configuration matérielle distribuée fondamentale sur laquelle un procédé d'application qui utilise le service de logiciel personnalisé s'exécute, et permet au service de logiciel personnalisé d'opérer plus efficacement, en réponse aux conditions environnementales d'exécution. Un directeur de service de défaut-tolérance est fourni comme interface de gestion à un service de défaut-tolérance. Le directeur de service de défaut-tolérance surveille le service de défaut-tolérance, aussi bien que la configuration matérielle distribuée fondamentale, pour prendre des décisions globalement optimales, basées sur des conditions ambiantes d'exécution, et pour fournir les informations résultantes au service de défaut-tolérance. Le directeur de service de défaut-tolérance peut informer le service de défaut-tolérance au sujet des états dangereux de réseau (tels que les centres serveurs d'objet qui peuvent se briser bientôt) et le service de défaut-tolérance peut décider d'émigrer des objets d'application ou de prendre l'autre modalité de reprise. Les conditions ambiantes rassemblées peuvent être employées pour déterminer une estimation de santé des composants dans l'environnement de calcul qui peut être utilisé, par exemple, pour choisir une machine optimale pour la migration, ou pour déclencher la migration ou la réplique additionnelle en cas l'estimation de santé indique qu'un échec est prévu.