An apparatus and protocol to determine the group of processors that will
survive communications faults and/or timed-event failures in a distributed
multiprocessor or clustered system. The processors are coupled to one
another by an inter-processor communication network that is used, inter
alia, by each processor to send path probe messages to each of the other
processor units on all available network paths. A processor is suspected
of being communicatively isolated, or having ceased operations, when one
or more of the other processors detects the absence of an acknowledgment
response from the processor. When this happens, all of the processors are
subjected to a series of stages in which they repeatedly broadcast their
status and connectivity to each other.
Um instrumento e um protocolo para determinar o grupo dos processadores que sobreviverão falhas das comunicações e/ou falhas do cronometr-evento em um multiprocessor distribuído ou aglomeraram o sistema. Os processadores são acoplados a um outro por uma rede de comunicação do inter-processador que seja usada, alia inter, por cada processador para emitir mensagens da ponta de prova do trajeto a cada uma das outras unidades do processador em todos os trajetos disponíveis da rede. Um processador está suspeitado communicatively de ser isolado, ou ser cessado operações, quando um ou mais dos outros processadores detectam a ausência de uma resposta do reconhecimento do processador. Quando isto acontece, todos os processadores estão sujeitados a uma série dos estágios em que se transmitem repetidamente seus status e connectivity.