This invention provides methods by which biologically derived DNA sequences
in a mixed sample or in an arrayed single sequence clone can be determined
and classified without sequencing. The methods make use of information on
the presence of carefully chosen target subsequences, typically of length
from 4 to 8 base pairs, and preferably the length between target
subsequences in a sample DNA sequence together with DNA sequence databases
containing lists of sequences likely to be present in the sample to
determine a sample sequence. The preferred method uses restriction
endonucleases to recognize target subsequences and cut the sample
sequence. Then carefully chosen recognition moieties are ligated to the
cut fragments, the fragments amplified, and the experimental observation
made. Polymerase chain reaction (PCR) is the preferred method of
amplification. Another embodiment of the invention uses information on the
presence or absence of carefully chosen target subsequences in a single
sequence clone together with DNA sequence databases to determine the clone
sequence. Computer implemented methods are provided to analyze the
experimental results and to determine the sample sequences in question and
to carefully choose target subsequences in order that experiments yield a
maximum amount of information.
Cette invention fournit les méthodes par lesquelles a biologiquement dérivé des ordres d'ADN dans un échantillon mélangé ou dans un clone simple rangé d'ordre peut être déterminé et classifié sans ordonnancement. Les méthodes se servent de l'information sur la présence des subsequences soigneusement choisis de cible, typique de longueur de 4 à 8 paires basses, et de préférence de la longueur entre les subsequences de cible dans un ordre d'ADN témoin ainsi que des bases de données d'ordre d'ADN contenant des listes d'ordres probablement pour être présentes dans l'échantillon pour déterminer un ordre d'échantillon. La méthode préférée emploie des ribonucléases de restriction pour identifier des subsequences de cible et pour couper l'ordre d'échantillon. Alors des parties soigneusement choisies d'identification sont ligaturées aux fragments de coupe, aux fragments amplifiés, et à l'observation expérimentale faite. La réaction en chaîne de polymérase (PCR) est la méthode préférée d'amplification. Une autre incorporation d'information d'utilisations d'invention sur la présence ou l'absence des subsequences soigneusement choisis de cible dans un clone simple d'ordre ainsi que des bases de données d'ordre d'ADN pour déterminer l'ordre de clone. Des méthodes appliquées par ordinateur sont fournies pour analyser les résultats expérimentaux et pour déterminer les ordres d'échantillon en question et pour choisir soigneusement des subsequences de cible pour que les expériences rapportent une quantité de l'information maximum.