A file server system tolerant to hardware and software failures is located
over a plurality of hardware nodes. The nodes of the system act as hosts
for software components of the system. Several of the software components
can be replicated. The replicable software components include the system
file store, a checker and a logger. The replicated components have one
primary copy and one or more back-up copies. Replica copies of a given
replicated component are each located at different nodes. Location and
handling of replica copies of a given replicable component is under the
control of a replication manager which is a (non-replicable) software
component of the system. The replication manager is distributed meaning it
can have one of its instances running on each node of the system. These
instances inter-communicate to maintain coherence. The failure detector is
also distributed, its instances running on each of the nodes, and
contributing to an early detection of hardware and software failures. The
file store is configured to hold stored objects and includes a signature
generator for computing an object-specific signature from an object. The
checker comprises a signature store for holding a previously computed
signature for each of the stored objects and a comparator operable to
compare a signature retrieved from the signature store with a
corresponding signature computed by the signature generator from an object
retrieved from the file store, thus to enhance system reliability.
Un sistema dell'assistente di lima tollerante ai guasti del software e dei fissaggi è situato sopra una pluralità di nodi dei fissaggi. I nodi del sistema fungono da ospiti per i componenti di software del sistema. Vari dei componenti di software possono essere ripiegati. I componenti di software replicable includono il deposito della lima di sistema, un ispettore e un registratore di dati atmosferici. I componenti ripiegati hanno una copia primaria ed una o più copie di sostegno. Le copie di dato componente ripiegato ciascuno della replica sono situate ai nodi differenti. La posizione e la manipolazione delle copie della replica di dato componente replicable è sotto il controllo di un responsabile della replica che è componente di software (non-replicable) di a del sistema. Il responsabile della replica è significato che distribuito può avere uno dei relativi casi che funzionano su ogni nodo del sistema. Questi casi comunicano per effettuare la coerenza. Il rivelatore di guasto inoltre è distribuito, i relativi casi che funzionano su ciascuno dei nodi e contribuenti ad un'individuazione tempestiva dei guasti del software e dei fissaggi. Il deposito della lima è configurato per tenere gli oggetti memorizzati ed include un generatore della firma per la computazione della firma di object-specifico da un oggetto. L'ispettore contiene un deposito della firma per la tenuta una firma precedentemente computata per ciascuno degli oggetti memorizzati e un comparatore operabile confrontare una firma ha richiamato dal deposito della firma con una firma corrispondente ha computato dal generatore della firma da un oggetto ha richiamato dal deposito della lima, così per aumentare l'affidabilità del sistema.