A nonparametric family of density functions formed by histogram estimators
for modeling acoustic vectors are used in automatic recognition of speech.
A Gaussian kernel is set forth in the density estimator. When the
densities are found for all the basic sounds in a training stage, an
acoustic vector is assigned to a phoneme label corresponding to the
highest likelihood for the basis of the decoding of acoustic vectors into
text.
Μια nonparametric οικογένεια των λειτουργιών πυκνότητας που διαμορφώνονται από τους εκτιμητές ιστογράμμων για τη διαμόρφωση των ακουστικών διανυσμάτων χρησιμοποιείται στην αυτόματη αναγνώριση της ομιλίας. Ένας γκαουσσιανός πυρήνας εκτίθεται στον εκτιμητή πυκνότητας. Όταν οι πυκνότητες βρίσκονται για όλους τους βασικούς ήχους σε ένα στάδιο κατάρτισης, ένα ακουστικό διάνυσμα ορίζεται σε μια ετικέτα φωνήματος που αντιστοιχεί στην υψηλότερη πιθανότητα για τη βάση της αποκωδικοποίησης των ακουστικών διανυσμάτων στο κείμενο.