Techniques for generating, distributing, and using speech recognition
models are described. A shared speech processing facility is used to
support speech recognition for a wide variety of devices with limited
capabilities including business computer systems, personal data
assistants, etc., which are coupled to the speech processing facility via
a communications channel, e.g., the Internet. Devices with audio capture
capability record and transmit to the speech processing facility, via the
Internet, digitized speech and receive speech processing services, e.g.,
speech recognition model generation and/or speech recognition services, in
response. The Internet is used to return speech recognition models and/or
information identifying recognized words or phrases. Thus, the speech
processing facility can be used to provide speech recognition capabilities
to devices without such capabilities and/or to augment a device's speech
processing capability. Voice dialing, telephone control and/or other
services are provided by the speech processing facility in response to
speech recognition results.
Οι τεχνικές για, και τα πρότυπα λεκτικής αναγνώρισης περιγράφονται. Μια κοινή δυνατότητα επεξεργασίας του λόγου χρησιμοποιείται για να υποστηρίξει τη λεκτική αναγνώριση για μια ευρεία ποικιλία των συσκευών με τις περιορισμένες ικανότητες συμπεριλαμβανομένων των συγκροτημάτων επιχειρησιακών ηλεκτρονικών υπολογιστών, των βοηθών προσωπικών στοιχείων, κ.λπ., οι οποίοι συνδέονται με τη δυνατότητα επεξεργασίας του λόγου μέσω ενός καναλιού επικοινωνιών, π.χ., το Διαδίκτυο. Οι συσκευές με τον ήχο συλλαμβάνουν το αρχείο ικανότητας και διαβιβάζουν στη δυνατότητα επεξεργασίας του λόγου, μέσω του Διαδικτύου, τη μεταλλαγμένη ομιλία και λαμβάνουν τις υπηρεσίες επεξεργασίας του λόγου, π.χ., την πρότυπες παραγωγή λεκτικής αναγνώρισης ή/και τις υπηρεσίες λεκτικής αναγνώρισης, στην απάντηση. Το Διαδίκτυο χρησιμοποιείται για να επιστρέψει τα πρότυπα ή/και τις πληροφορίες λεκτικής αναγνώρισης που προσδιορίζουν τις αναγνωρισμένες λέξεις ή τις φράσεις. Κατά συνέπεια, η δυνατότητα επεξεργασίας του λόγου μπορεί να χρησιμοποιηθεί για να παρέχει τις ικανότητες λεκτικής αναγνώρισης στις συσκευές χωρίς τέτοιες ικανότητες ή/και για να αυξήσει την ικανότητα επεξεργασίας του λόγου μιας συσκευής. Ο σχηματισμός φωνής, ο τηλεφωνικός έλεγχος ή/και άλλες υπηρεσίες παρέχονται από τη δυνατότητα επεξεργασίας του λόγου σε απάντηση στα αποτελέσματα λεκτικής αναγνώρισης.