A system and method for improving the isolation and diagnosis of hardware
faults in a computing system wherein means are provided for indicating
whether unusable data has previously triggered diagnosis of the hardware
fault that caused the data to be unusable. If diagnosis has not been
performed, the flag is not set. If diagnosis has already been performed,
the flag is set. One embodiment comprises an interface which is used to
convey data from one subsystem to another. When the interface receives
data from the first subsystem, the data is examined to determine whether
it contains an uncorrectable error (including missing data.) If the data
contains an uncorrectable error, the interface examines the flag
corresponding to the data to determine whether hardware fault diagnosis
has already been initiated. If diagnosis has already been initiated, the
data is passed to the second subsystem without initiating further
diagnosis. If diagnosis has not been initiated, the interface initiates
diagnosis and sets the flag to indicate that diagnosis has already been
initiated. The data and corresponding flag are then passed to the second
subsystem. If the data contains an uncorrectable error, data error
handling procedures will be performed by the subsystem that requested the
data, regardless of the value of the corresponding flag.
Un sistema y un método para mejorar el aislamiento y la diagnosis del hardware critica en un sistema de cálculo en donde los medios se proporcionan para indicar si los datos inutilizables han accionado previamente la diagnosis de la avería del hardware que hizo los datos ser inutilizables. Si la diagnosis no se ha realizado, la bandera no se fija. Si la diagnosis se ha realizado ya, se fija la bandera. Una encarnación abarca un interfaz que se utilice para transportar datos a partir de un subsistema a otro. Cuando el interfaz recibe datos del primer subsistema, los datos se examinan para determinarse si contienen un error uncorrectable (datos que falta incluyendo.) Si los datos contienen un error uncorrectable, el interfaz examina la bandera que corresponde a los datos para determinarse si la diagnosis de avería del hardware se ha iniciado ya. Si la diagnosis se ha iniciado ya, los datos se pasan al segundo subsistema sin iniciar diagnosis adicional. Si la diagnosis no se ha iniciado, el interfaz inicia diagnosis y fija la bandera para indicar que la diagnosis se ha iniciado ya. Los datos y la bandera correspondiente entonces se pasan al segundo subsistema. Si los datos contienen un error uncorrectable, los procedimientos de la gestión de error de los datos serán realizados por el subsistema que solicitó los datos, sin importar el valor de la bandera correspondiente.