A method is presented that enhances the survivability of system software
components, even in the event of catastrophic failure of the computing
element on which they reside. In particular, the combination of a
distributed operating system (Non Stop Clusters) and a fault-tolerant
interconnect (ServerNet) provides an environment conducive to posthumous
recovery strategies that have been unavailable in previous distributed
computing environments. The specific strategy outlined here is called
resource harvesting, and involves a novel approach that retrieve critical
data structures of memory from a failed computing element for
reconstruction on a non-failed computing element, allowing such critical
data structures to continue with their original function.
Un metodo è presentato che aumenta il survivability dei componenti di software del sistema, anche in caso di guasto catastrofico dell'elemento di calcolo su cui risiedono. In particolare, la combinazione di un sistema operativo distribuito (non serie di ingranaggi di arresto) e di un'interconnessione fault-tolerant (ServerNet) fornisce un ambiente tendente alle strategie posthumous di recupero che sono state non disponibili negli ambienti precedenti di computazione distribuita. La strategia specifica delineare qui è denominata risorsa che raccoglie e che coinvolge un metodo del romanzo che richiama le strutture di dati critiche della memoria da un elemento di calcolo guastato per ricostruzione su un elemento di calcolo non-venuto a mancare, permettendo che tali strutture di dati critiche continuino con la loro funzione originale.