Information regarding the operating conditions of a computer system is
stored in a storage which is dedicated to a failure management system. The
storage is updated with the current operating conditions either
periodically or upon the occurrence of predetermined events. When a first
failure identification mechanism identifies a failure in the computer
system, a capture mechanism interrupts the updating of the storage leaving
information regarding operating conditions which contributed to the
failure in the storage. This latter information can then be read out to
aid in diagnosis of the failure. Since the operating condition information
is stored in a dedicated storage, the information is not modified by
events that take place after the failure is identified. In accordance with
one embodiment, the computer system ordinarily holds state and other
operating information in a set of storage devices, such as, for example,
state registers. The dedicated storage device can be a shadow register or
other shadow storage device for holding a separate dedicated copy of at
least a portion of the operating information so that it is readily
available in case a failure is detected. During operation, an updating
mechanism continually transfers the information in the state registers to
the shadow register until a first failure is detected. When a failure is
detected, a capture mechanism controls the updating mechanism to cease
transferring information from the state registers to the shadow register.
The shadow register can then output its contents, e.g., for analysis,
preferably under computer program control.
Le informazioni per quanto riguarda le condizioni di gestione di un sistema di elaborazione sono memorizzate in un immagazzinaggio che è dedicato ad un sistema di amministrazione di guasto. L'immagazzinaggio è aggiornato periodicamente con le condizioni di gestione attuali o sul caso degli eventi predeterminati. Quando un primo meccanismo dell'identificazione di guasto identifica un guasto nel sistema di elaborazione, un meccanismo di bloccaggio interrompe l'aggiornamento dell'immagazzinaggio che lascia le informazioni per quanto riguarda le condizioni di gestione che hanno contribuito al guasto nell'immagazzinaggio. Queste informazioni posteriori possono allora essere lette fuori per aiutare nella diagnosi del guasto. Poiché le informazioni di condizione di gestione sono memorizzate in un immagazzinaggio dedicato, le informazioni non sono modificate dagli eventi che avvengono dopo che il guasto sia identificato. In conformità con un incorporamento, le strette del sistema di elaborazione ordinariamente dichiarano ed altre informazioni di funzionamento in un insieme dei dispositivi di memorizzazione, come, per esempio, dichiarano i registri. Il dispositivo di memorizzazione dedicato può essere un registro dell'ombra o l'altro dispositivo di memorizzazione dell'ombra per la tenuta una copia dedicata separata almeno di una parte delle informazioni di funzionamento in modo che sia prontamente disponibile nel caso un guasto è rilevato. Durante il funzionamento, un meccanismo di aggiornamento trasferisce continuamente le informazioni nei registri di dichiarare al registro dell'ombra fino a rilevare un primo guasto. Quando un guasto è rilevato, un meccanismo di bloccaggio controlla il meccanismo di aggiornamento per cessare di trasferire le informazioni dai registri di dichiarare al registro dell'ombra. Il registro dell'ombra può allora produrre il relativo soddisfare, per esempio, per analisi, preferibilmente sotto controllo di programma destinato all'elaboratore.