A method and system for managing uncorrectable data error conditions from
an I/O subsystem as the UE passes through a plurality of devices in a
central electronic complex (CEC) is disclosed. The method and system
comprises detecting a I/O UE by at least one device in the CEC; and
providing an SUE-RE (Special Uncorrectable Data Error-Recoverable Error)
attention signal by at least one device to a diagnostic system that
indicates the I/O UE condition. The method and system further includes
analyzing the SUE-RE attention signal by the diagnostic system to produce
an error log with a list of failing parts and a record of the log. A
method and system in accordance with the present invention provides a new
fault isolation methodology and algorithm, which extends the current
capability of a service processor runtime diagnostic code (PRD). The
method allows for the accurate determination of an error source and
provides appropriate service action if and when the system fails to
recover from the UE condition. This new methodology allows a more focused
determination of error source and appropriate service action if and when
the system fails to recover from an I/O UE.
Een methode en een systeem om de uncorrectable voorwaarden van de gegevensfout van een I/O subsysteem te beheren aangezien UE door een meerderheid van apparaten in centrale elektronische complex (CEG) overgaat worden onthuld. De methode en het systeem bestaan uit het ontdekken van een I/O UE door minstens één apparaat in CEG; en verstrekkend een ver*volgen-RE (de Speciale fout-Terug te krijgen Fout van Gegevens Uncorrectable) waarschuwingssignaal door minstens één apparaat aan een kenmerkend systeem dat op de I/O voorwaarde UE wijst. De methode en het systeem omvatten verder het analyseren van het ver*volgen-RE waarschuwingssignaal door het kenmerkende systeem om een foutenlogboek met een lijst van ontbrekende delen en een verslag van het logboek te veroorzaken. Een methode en een systeem overeenkomstig de onderhavige uitvinding verstrekken een nieuw methodologie en een algoritme van de foutenisolatie, dat het huidige vermogen van een runtime van de de dienstbewerker kenmerkende code (PRD) uitbreidt. De methode staat voor de nauwkeurige bepaling van een foutenbron toe en verstrekt aangewezen de dienstactie als en wanneer het systeem om van de voorwaarde er niet in slaagt terug te krijgen UE. Deze nieuwe methodologie staat een meer geconcentreerde bepaling van foutenbron en aangewezen de dienstactie als toe en wanneer het systeem om van een I/O UE er niet in slaagt terug te krijgen.