The present invention relates to a method and system for efficiently
identifying errant processes in a computer system using an operating
system (OS) error recovery method that identifies if the error caused by
the errant process can be recovered and, if so, can recover from the
error. The method and system of the present invention operates after
standard Error Correcting Code (ECC) and parity check bit methods and
systems are unsuccessful in recovering from the error In accordance with
an embodiment of the present invention, the method and system includes
detecting an error during instruction execution, storing a physical
address of an errant process that caused the error, and storing an
execution instruction pointer (IP) in an interruption instruction pointer
(IIP). The method further includes determining a first virtual address
from an operating system mapping table, determining a second virtual
address from a translation look-aside buffer, and identifying the errant
process, if the physical address and the second virtual address match the
physical address and the first virtual address.
La présente invention concerne une méthode et un système pour identifier efficacement des processus errants dans un système informatique en utilisant une méthode de rétablissement d'erreur du logiciel d'exploitation (OS) qui identifie si l'erreur provoquée par le processus errant peut être récupérée et, si oui, peut récupérer de l'erreur. La méthode et système de la présente invention fonctionne après l'erreur type corrigeant le code (ECC) et les méthodes de peu de contrôle de parité et des systèmes sont non réussies dans la récupération de l'erreur selon un mode de réalisation de la présente invention, la méthode et le système inclut détecter une erreur pendant l'exécution d'instruction, stockant une adresse physique d'un processus errant qui a causé l'erreur, et stockant un indicateur d'instruction d'exécution (IP) dans un indicateur d'instruction d'interruption (IIP). La méthode autre inclut déterminer une première adresse virtuelle d'un logiciel d'exploitation traçant la table, déterminant une deuxième adresse virtuelle d'un amortisseur look-aside de traduction, et identifiant le processus errant, si l'adresse physique et la deuxième allumette virtuelle d'adresse l'adresse physique et la première adresse virtuelle.