The present invention is a reliable system and method for detecting a
recorded voice, which can be employed independently or to provide
protection from fraudulent use of a recording to defeat an automatic
speaker recognition system. Several techniques and systems are employed
either independently or in combination to verify that a detected audio
sample is live and not recorded. Temporal speech characteristics of an
audio sample are analyzed to determine whether a sample under examination
is so similar to a previous sample as to indicate a recording.
Communications channel characteristics are examined to determine whether
an sample was recorded on a different channel from a predetermined
communications channel. A pattern classifier is trained to distinguish
between live and recorded speech. Finally, an "audio watermark" is used to
determine whether a detected audio sample is a recording of a previous
communication by an authorized user. In addition, the various techniques
of the present invention may be employed in serial or parallel combination
with a variety of decisionmaking schemes to provide increased performance.
Η παρούσα εφεύρεση είναι ένα αξιόπιστες σύστημα και μια μέθοδος για μια καταγραμμένη φωνή, η οποία μπορεί να υιοθετηθεί ανεξάρτητα ή να παρέχει την προστασία από την ψευδή χρήση μιας καταγραφής για να νικήσει ένα αυτόματο σύστημα αναγνώρισης ομιλητών. Διάφορα τεχνικές και συστήματα υιοθετούνται είτε ανεξάρτητα είτε σε συνδυασμό για να ελέγξουν ότι ένα ανιχνευμένο ακουστικό δείγμα είναι ζωντανό και μην καταγραμμένο. Τα χρονικά λεκτικά χαρακτηριστικά ενός ακουστικού δείγματος αναλύονται για να καθορίσουν εάν ένα δείγμα υπό εξέταση είναι τόσο παρόμοιο με ένα προηγούμενο δείγμα ώστε να υποδειχθεί μια καταγραφή. Τα χαρακτηριστικά καναλιών επικοινωνιών εξετάζονται για να καθορίσουν εάν ένα δείγμα καταγράφηκε σε ένα διαφορετικό κανάλι από ένα προκαθορισμένο κανάλι επικοινωνιών. Ένας ταξινομητής σχεδίων εκπαιδεύεται για να διακρίνει μεταξύ της ζωντανής και καταγραμμένης ομιλίας. Τέλος, ένα "ακουστικό υδατόσημο" χρησιμοποιείται για να καθορίσει εάν ένα ανιχνευμένο ακουστικό δείγμα είναι μια καταγραφή μιας προηγούμενης επικοινωνίας από έναν εξουσιοδοτημένο χρήστη. Επιπλέον, οι διάφορες τεχνικές της παρούσας εφεύρεσης μπορούν να υιοθετηθούν σε τμηματικό ή παράλληλο συνδυασμό με ποικίλα σχέδια λήψης αποφάσεων να παρασχεθεί η αυξανόμενη απόδοση.