Methods and apparatus for generating, updating and distributing speech recognition models page

Techniques for generating, distributing, and using speech recognition models are described. A shared speech processing facility is used to support speech recognition for a wide variety of devices with limited capabilities including business computer systems, personal data assistants, etc., which are coupled to the speech processing facility via a communications channel, e.g., the Internet. Devices with audio capture capability record and transmit to the speech processing facility, via the Internet, digitized speech and receive speech processing services, e.g., speech recognition model generation and/or speech recognition services, in response. The Internet is used to return speech recognition models and/or information identifying recognized words or phrases. Thus, the speech processing facility can be used to provide speech recognition capabilities to devices without such capabilities and/or to augment a device's speech processing capability. Voice dialing, telephone control and/or other services are provided by the speech processing facility in response to speech recognition results.

Οι τεχνικές για, και τα πρότυπα λεκτικής αναγνώρισης περιγράφονται. Μια κοινή δυνατότητα επεξεργασίας του λόγου χρησιμοποιείται για να υποστηρίξει τη λεκτική αναγνώριση για μια ευρεία ποικιλία των συσκευών με τις περιορισμένες ικανότητες συμπεριλαμβανομένων των συγκροτημάτων επιχειρησιακών ηλεκτρονικών υπολογιστών, των βοηθών προσωπικών στοιχείων, κ.λπ., οι οποίοι συνδέονται με τη δυνατότητα επεξεργασίας του λόγου μέσω ενός καναλιού επικοινωνιών, π.χ., το Διαδίκτυο. Οι συσκευές με τον ήχο συλλαμβάνουν το αρχείο ικανότητας και διαβιβάζουν στη δυνατότητα επεξεργασίας του λόγου, μέσω του Διαδικτύου, τη μεταλλαγμένη ομιλία και λαμβάνουν τις υπηρεσίες επεξεργασίας του λόγου, π.χ., την πρότυπες παραγωγή λεκτικής αναγνώρισης ή/και τις υπηρεσίες λεκτικής αναγνώρισης, στην απάντηση. Το Διαδίκτυο χρησιμοποιείται για να επιστρέψει τα πρότυπα ή/και τις πληροφορίες λεκτικής αναγνώρισης που προσδιορίζουν τις αναγνωρισμένες λέξεις ή τις φράσεις. Κατά συνέπεια, η δυνατότητα επεξεργασίας του λόγου μπορεί να χρησιμοποιηθεί για να παρέχει τις ικανότητες λεκτικής αναγνώρισης στις συσκευές χωρίς τέτοιες ικανότητες ή/και για να αυξήσει την ικανότητα επεξεργασίας του λόγου μιας συσκευής. Ο σχηματισμός φωνής, ο τηλεφωνικός έλεγχος ή/και άλλες υπηρεσίες παρέχονται από τη δυνατότητα επεξεργασίας του λόγου σε απάντηση στα αποτελέσματα λεκτικής αναγνώρισης.