Method and system to identify a memory corruption source within a multiprocessor system

   
   

A method and system for identifying a source of a corrupt data in a memory in a multiprocessor computer system. When a computer program stores corrupt data causing a program failure or a system crash, the corrupt data and its address are identified. The multiprocessor computer system is shut down, and the corrupt data is cleared from the memory. Before fully re-booting the multiprocessor computer system, a processor is selected from the multiprocessor computer system to load and run monitor code designed to monitor the location where the corrupt data was stored. The program that previously stored the corrupt data is restarted, and the selected processor detects any re-storage of the corrupt data in the same memory address. All processors in the computer system are then immediately suspended. The registers of all processors suspected of storing corrupt data are inspected to determine the source of the corrupt data.

Une méthode et un système pour identifier une source de données corrompues dans une mémoire dans un système informatique de multiprocesseur. Quand les magasins d'un programme machine corrompent des données causant un échec de programme ou un arrêt du système, les données corrompues et son adresse sont identifiées. Le système informatique de multiprocesseur est arrêté, et les données corrompues sont se sont dégagées de la mémoire. Avant entièrement re-initialiser le système informatique de multiprocesseur, un processeur est choisi parmi le système informatique de multiprocesseur pour charger et le code couru de moniteur conçu pour surveiller l'endroit où les données corrompues ont été stockées. Le programme qui a précédemment stocké les données corrompues est remis en marche, et le processeur choisi détecte n'importe quel relogement des données corrompues dans la même adresse de mémoire. Tous les processeurs dans le système informatique alors sont immédiatement suspendus. Les registres de tous les processeurs suspectés de stocker des données corrompues sont inspectés pour déterminer la source de données corrompues.

 
Web www.patentalert.com

< Managing disk drive replacements on mulitidisk headless appliances

< Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex

> Memory sub-system error cleansing

> Problem detector and method

~ 00155