The present invention is a system and method for recovering from memory
failures in computer systems. The method of the present invention includes
the steps of: identifying a predetermined instruction sequence; monitoring
for memory access errors in response to the request; logging a memory
access error in an error logging register; polling the register for any
logged memory access error during execution of the instruction sequence;
and raising exceptions, if the memory access error is logged. Within the
system of the present invention, memory access errors are stored in an
error logging register, machine check abort handles are masked, and memory
controllers are under full control of the software so that memory access
errors can be intercepted and responded to without necessitating a system
reboot or application restart. The present invention is particularly
applicable to O/S code which can not otherwise recover from memory errors
except by rebooting.
La presente invenzione è un sistema e un metodo per recuperare dai guasti di memoria nei sistemi di elaborazione. Il metodo di presente invenzione include i punti di: identificare una sequenza di istruzione predeterminata; controllando per gli errori di accesso di memoria in risposta alla richiesta; annotare un errore di accesso di memoria in un registro annotare di errore; votazione il registro per qualsiasi errore annotato di accesso di memoria durante l'esecuzione della sequenza di istruzione; e sollevando le eccezioni, se l'errore di accesso di memoria è annotato. All'interno del sistema di presente invenzione, gli errori di accesso di memoria sono immagazzinati in un registro annotare di errore, le maniglie della terminazione del controllo della macchina sono mascherate ed i regolatori di memoria sono sotto controllo completo del software in moda da potere essere intercettato e rispondere gli errori di accesso di memoria senza a rendere necessario un riavviamento di reboot o di applicazione del sistema. La presente invenzione è particolarmente applicabile al codice di O/S che non può recuperare al contrario dagli errori di memoria tranne rebooting.