A method and system for recognizing user input information including
cursive handwriting and spoken words. A time-delayed neural network having
an improved architecture is trained at the word level with an improved
method, which, along with preprocessing improvements, results in a
recognizer with greater recognition accuracy. Preprocessing is performed
on the input data and, for example, may include resampling the data with
sample points based on the second derivative to focus the recognizer on
areas of the input data where the slope change per time is greatest. The
input data is segmented, featurized and fed to the time-delayed neural
network which outputs a matrix of character scores per segment. The neural
network architecture outputs a separate score for the start and the
continuation of a character. A dynamic time warp (DTW) is run against
dictionary words to find the most probable path through the output matrix
for that word, and each word is assigned a score based on the least costly
path that can be traversed through the output matrix. The word (or words)
with the overall lowest score (or scores) are returned. A DTW is similarly
used in training, whereby the sample ink only need be labeled at the word
level.
Μια μέθοδος και ένα σύστημα για τις πληροφορίες εισαγωγής χρηστών συμπεριλαμβανομένης της ρέουσας γραφής και των προφορικών λέξεων. Ένα time-delayed νευρικό δίκτυο που έχει μια βελτιωμένη αρχιτεκτονική εκπαιδεύεται στο επίπεδο λέξης με μια βελτιωμένη μέθοδο, η οποία, μαζί με την προεπεξεργασία των βελτιώσεων, οδηγεί σε ένα σύστημα αναγνώρισης με τη μεγαλύτερη ακρίβεια αναγνώρισης. Η προεπεξεργασία εκτελείται στα δεδομένα εισόδου και, παραδείγματος χάριν, μπορεί να περιλάβει τη λήψη δείγματος των στοιχείων με τα σημεία δειγμάτων βασισμένα στο δεύτερο παράγωγο για να στρέψουν το σύστημα αναγνώρισης στους τομείς των δεδομένων εισόδου όπου η αλλαγή κλίσεων ανά χρόνο είναι μέγιστη. Το δεδομένο εισόδου είναι τεμμένο, και τααΐε στο time-delayed νευρικό δίκτυο που τα αποτελέσματα μια μήτρα του χαρακτήρα σημειώνουν ανά τμήμα. Τα νευρικά αποτελέσματα δικτυακής αρχιτεκτονικής ένα χωριστό αποτέλεσμα για την έναρξη και η συνέχεια ενός χαρακτήρα. Μια δυναμική χρονική στρέβλωση (DTW) αντιτίθεται τις λέξεις λεξικών για να βρεί την πιθανότερη πορεία μέσω της μήτρας παραγωγής για εκείνη την λέξη, και σε κάθε λέξη ορίζεται ένα αποτέλεσμα βασισμένο στη λιγότερη δαπανηρή πορεία που μπορεί να διαπερνηθεί μέσω της μήτρας παραγωγής. Η λέξη (ή λέξεις) με το γενικό χαμηλότερο αποτέλεσμα (ή τα αποτελέσματα) επιστρέφεται. Ένα DTW χρησιμοποιείται ομοίως στην κατάρτιση, με το οποίο το μελάνι δειγμάτων χρειάζεται μόνο να ονομαστεί στο επίπεδο λέξης.