Coordinating persistent status information with multiple file servers

   
   

The invention provides a storage system, and a method for operating a storage system, that provides for relatively rapid and reliable takeover among a plurality of independent file servers. Each file server maintains a reliable communication path to the others. Each file server maintains its own state in reliable memory. Each file server regularly confirms the state of the other file servers. Each file server labels messages on the redundant communication paths, so as to allow other file servers to combine the redundant communication paths into a single ordered stream of messages. Each file server maintains its own state in its persistent memory and compares that state with the ordered stream of messages, so as to determine whether other file servers have progressed beyond the file server's own last known state. Each file server uses the shared resources (such as magnetic disks) themselves as part of the redundant communication paths, so as to prevent mutual attempts at takeover of resources when each file server believes the other to have failed. Each file server provides a status report to the others when recovering from an error, so as to prevent the possibility of multiple file servers each repeatedly failing and attempting to seize the resources of the others.

La invención proporciona un sistema del almacenaje, y un método para funcionar un sistema del almacenaje, que preve la toma de posesión relativamente rápida y confiable entre una pluralidad de servidores de archivo independientes. Cada servidor de archivo mantiene una trayectoria de comunicación confiable a las otras. Cada servidor de archivo mantiene su propio estado en memoria confiable. Cada servidor de archivo confirma regularmente el estado de los otros servidores de archivo. Cada servidor de archivo etiqueta mensajes en las trayectorias de comunicación redundantes, para permitir que otros servidores de archivo combinen las trayectorias de comunicación redundantes en una sola corriente pedida de mensajes. Cada servidor de archivo mantiene su propio estado en su memoria persistente y compara ese estado con la corriente pedida de mensajes, para determinarse si otros servidores de archivo han progresado más allá estado sabido pasado del servidor de archivo del propio. Cada servidor de archivo utiliza los recursos compartidos (tales como discos magnéticos) ellos mismos como parte de las trayectorias de comunicación redundantes, para prevenir tentativas mutuas en la toma de posesión de recursos cuando cada servidor de archivo cree el otro para haber fallado. Cada servidor de archivo proporciona un informe a los otros al recuperarse de un error, para prevenir la posibilidad de servidores de archivo múltiples cada uno que no puede en varias ocasiones y que procura para agarrar los recursos de los otros.

 
Web www.patentalert.com

< System, device, and method for providing mutual exclusion for computer system resources

< Method and apparatus for handling nested faults

> Dynamically adaptive network element in a feedback-based data network

> Method for concurrent multiple services in a mobile communication system

~ 00149