The present invention provides a system, apparatus, and method for managing
a data storage system in n-way active controller configuration, such that
a controller can detect the failure of and reset more than just a single
other controller. To accomplish this, a controller sends a ping message to
at least a subset of the other controllers, and waits for any of the other
controllers to respond to the ping message within a first predetermined
amount of time. If any of the other controllers do not respond to the ping
message within the first predetermined amount of time, it is determined
that the non-responding controller has failed. The controller will reset
any failed controller.
A invenção atual fornece um sistema, um instrumento, e um método controlando um sistema do armazenamento de dados de na configuração ativa do controlador da n-maneira, tal que um controlador pode detectar a falha de e restaurar mais do que apenas um único o outro controlador. Para realizar este, um controlador emite uma mensagem do sibilo ao menos a um subconjunto dos outros controladores, e espera alguns dos outros controladores para responder à mensagem do sibilo dentro de uma primeira quantidade de tempo predeterminada. Se alguns dos outros controladores não responderem à mensagem do sibilo dentro do primeira predeterminarem uma quantidade de tempo, ele forem determinados que o controlador non-responding falhou. O controlador restaurará todo o controlador falhado.