The invention provides a method for separating two or more subsets of
polypeptides within a set of polypeptides. The method includes the steps
of: (a) determining a sequence comparison signature for each amino acid
sequence in a set of amino acid sequences, wherein the sequence comparison
signature includes pairwise comparison scores for the amino acid sequence
compared to each of the other amino acid sequences in the set; (b)
constructing a distance arrangement including the sequence comparison
signatures related according to the distance between each of the sequence
comparison signatures; and (c) identifying a first and second cluster of
sequence comparison signatures in the distance arrangement, wherein the
first cluster includes sequence comparison signatures for polypeptides
having a similar protein fold or biological function, the protein fold or
function being different compared to a protein fold or function of
polypeptides having sequence comparison signatures in the second cluster.
L'invenzione fornisce un metodo per le separazioni dei due o più sottoinsiemi dei polipeptidi all'interno di un insieme dei polipeptidi. Il metodo include i punti di: (a) determinando una firma di confronto di sequenza per ogni sequenza dell'amminoacido in un insieme delle sequenze dell'amminoacido, in cui la firma di confronto di sequenza include al paio i segni di confronto per la sequenza dell'amminoacido confrontata a ciascuna delle altre sequenze dell'amminoacido nell'insieme; (b) costruendo una disposizione di distanza compreso le firme di confronto di sequenza si è riferito secondo la distanza fra ciascuna delle firme di confronto di sequenza; e (c) identificando una prima e seconda serie di ingranaggi delle firme di confronto di sequenza nella disposizione di distanza, in cui la prima serie di ingranaggi include le firme di confronto di sequenza per i polipeptidi che hanno un popolare simile della proteina o una funzione biologica, il popolare o la funzione della proteina che sono differente confrontato ad un popolare della proteina o funzione dei polipeptidi che hanno firme di confronto di sequenza nella seconda serie di ingranaggi.