A system and method for improving the accuracy of DNA sequencing and error
probability estimation through application of a mathematical model to the
analysis of electropherograms. The method includes processing a plurality
of information obtained from a base calling system and creating a
plurality of refined base calls using a plurality of original base calls
and a plurality of intrinsic peak characteristics. A quality value is also
assigned to each of the plurality of refined base calls using the
plurality of intrinsic peak characteristics. Processing comprises
detecting a plurality of peaks, expanding the plurality of peaks, and
resolving the plurality of expanded peaks. Resolving may include fitting
the plurality of expanded peaks using a model of a peak shape. A peak
resolution parameter is calculated and used in processing. The system may
also be trained.
Ένα σύστημα και μια μέθοδος για την ακρίβεια της αλληλοuχίας DNA και της εκτίμησης πιθανότητας λάθους μέσω της εφαρμογής ενός μαθηματικού προτύπου στην ανάλυση των ηλεκτροφερογραμμάτων. Η μέθοδος περιλαμβάνει την επεξεργασία μιας πολλαπλότητας των πληροφοριών που λαμβάνεται από ένα καλώντας σύστημα βάσεων και τη δημιουργία μιας πολλαπλότητας των καθαρισμένων κλήσεων βάσεων χρησιμοποιώντας μια πολλαπλότητα των αρχικών κλήσεων βάσεων και μια πολλαπλότητα των εγγενών μέγιστων χαρακτηριστικών. Μια ποιοτική αξία ορίζεται επίσης σε κάθε μια από την πολλαπλότητα των καθαρισμένων κλήσεων βάσεων χρησιμοποιώντας την πολλαπλότητα των εγγενών μέγιστων χαρακτηριστικών. Η επεξεργασία περιλαμβάνει την ανίχνευση μιας πολλαπλότητας των αιχμών, την επέκταση της πολλαπλότητας των αιχμών, και την επίλυση της πολλαπλότητας των επεκταθεισών αιχμών. Η επίλυση μπορεί να περιλάβει την εγκατάσταση της πολλαπλότητας των επεκταθεισών αιχμών χρησιμοποιώντας ένα πρότυπο μιας μέγιστης μορφής. Μια μέγιστη παράμετρος ψηφίσματος υπολογίζεται και χρησιμοποιείται στην επεξεργασία. Το σύστημα μπορεί επίσης να εκπαιδευθεί.