Fault tolerant computer system

A computer system uses redundant voting at the hardware clock level to detect and to correct single event upsets (SEU) and other random failures. In one preferred embodiment, the computer includes four or more commercial processing units (CPUs) operating in strict "lock-step" and whose outputs (33, 37) to system memory and system bus are voted by a gate array which may be implemented in a custom integrated circuit. A custom memory controller interfaces to the system memory and system bus. The data and address (35, 37) at each write to and read from memory within the computer are voted at each CPU clock cycle. A vote status and control circuit "reads" the status of the vote and controls the state of the CPUs using hardware and software. The majority voted signals are used by the agreeing CPUs 32 to continue processing operations without interruption. The system logic selects the best chance of recovering from a detected fault by re-synchronizing all CPUs, powering down a faulty CPU or switching to a spare computer, resetting and re-booting the substituted CPUs.
Um sistema computatorizado usa votar redundante no nível do pulso de disparo da ferragem para detectar e corrigir as únicas viradas do evento (SEU) e outras falhas aleatórias. Em um preferiu a incorporação, o computador inclui umas unidades processando quatro ou mais comerciais (CPUs) que operam-se na "fechamento-etapa estrita" e cujas as saídas (33, 37) à memória de sistema e à barra-ônibus do sistema são votados por uma disposição de porta que possa ser executada em um circuito integrado feito sob encomenda. Um controlador da memória do costume conectara à barra-ônibus da memória de sistema e do sistema. Os dados e o endereço (35, 37) em cada um escrevem a e lêem da memória dentro do computador são votados em cada ciclo de pulso de disparo do processador central. Um circuito do status e de controle do voto "lê" o status do voto e controla o estado do CPUs usando a ferragem e o software. Os sinais votados maioria são usados pelo CPUs concordando 32 continuar operações processando sem o interruption. A lógica do sistema seleciona a mais melhor possibilidade de recuperar de uma falha detectada re-sincronizando todo o CPUs, powering abaixo um processador central defeituoso ou comutando a um computador de reposição, restaurando e recarregando o CPUs substituído.

Web www.patentalert.com

< (none)

< Method and apparatus for creating communities of trust in a secure communication system

> Error control method for multiparty multimedia communications

> (none)

~ 00003