The invention described in the instant application provides for a
failure-recovery module, which permits automatic investigation of possible
reasons for the failure and takes corrective action in a manner
transparent to the user. The failure-recovery module, which is a software
module, is useful in evaluating a device connected to a master-slave bus
to determine whether it has failed. In the event the device is still
connected to the master-slave bus but is non-responsive, the
failure-recovery module resets the device, e.g., by turning off the power
to the affected device and rebooting the device with a cold start. The
failure-recovery module diagnoses the failure of a device by determining
if the device is still connected to the master-slave bus. Then, the
failure-recovery module sets a flag to mark the device as having failed
while disabling access to devices downstream of the failed device. If the
failure-recovery module is unable to execute successfully, it assumes that
the failure causing condition still exists. In some embodiments this
results in rescheduling the execution of the failure-recovery module while
in other embodiments a general failure may be declared or the failed
device left in its disconnected state. On the other hand, if the
failure-recovery module executes successfully, the affected device is
reinitialized and the flags marking it as failed are cleared with access
to the device being restored. Subsequently, downstream devices are
reinitialized and resources, if available, allocated to them along with
enumeration of the devices.
La invención descrita en el uso instantáneo preve un módulo de la falta-recuperacio'n, que permite la investigación automática de las razones posibles de la falta y lleva la acción correctiva de una manera transparente el usuario. El módulo de la falta-recuperacio'n, que es un módulo del software, es útil en la evaluación de un dispositivo conectado con un autobús amo-esclavo para determinarse si ha fallado. En el acontecimiento el dispositivo está conectado con el autobús amo-esclavo pero sigue siendo no sensible, los reajustes del módulo de la falta-recuperacio'n el dispositivo, e.g., dando vuelta de la energía al dispositivo afectado y reanudando el dispositivo con un arranque en frio. El módulo de la falta-recuperacio'n diagnostica la falta de un dispositivo determinándose si el dispositivo todavía está conectado con el autobús amo-esclavo. Entonces, el módulo de la falta-recuperacio'n fija una bandera para marcar el dispositivo como siendo fallado mientras que inhabilita el acceso a los dispositivos río abajo del dispositivo fallado. Si el módulo de la falta-recuperacio'n no puede ejecutarse con éxito, asume que todavía existe la falta que causa la condición. En algunas encarnaciones esto da lugar a cambiar la hora la ejecución del módulo de la falta-recuperacio'n mientras que en otras encarnaciones una falta general puede ser declarada o del dispositivo fallado a la izquierda en su estado desconectado. Por otra parte, si el módulo de la falta-recuperacio'n se ejecuta con éxito, el dispositivo afectado está reinicializado y las banderas que lo marcan como fallado son despejaron con el acceso al dispositivo que es restaurado. Posteriormente, los dispositivos enes sentido descendiente están reinicializados y los recursos, si esta'n disponibles, se asignan a ellos junto con la enumeración de los dispositivos.