A multimedia search apparatus and method for searching multimedia content
using speaker detection to segment the multimedia content. The multimedia
search apparatus receives a search request from a user device. The search
request identifies the target speaker for which the search is to be
conducted. Based on the search request, the multimedia search apparatus
retrieves multimedia content from a multimedia database. The multimedia
search apparatus retrieves models, such as Gaussian Mixture Models (GMMs),
from a model storage device, corresponding to the target speaker and
background data. Based on the retrieved models, the multimedia search
device searches the audio data of the multimedia content and segments the
audio data. The segments are identified by calculating an average
normalized score for a block of frames of the audio data and determining
if the average normalized score for the block of frames exceeds one or
more predetermined thresholds.
Μια συσκευή και μια μέθοδος αναζήτησης πολυμέσων για τα πολυμέσα ικανοποιούν τη χρησιμοποίηση της ανίχνευσης ομιλητών για να τέμνουν το περιεχόμενο πολυμέσων. Η συσκευή αναζήτησης πολυμέσων λαμβάνει ένα αίτημα αναζήτησης από μια συσκευή χρηστών. Το αίτημα αναζήτησης προσδιορίζει τον ομιλητή στόχων για το οποίο η αναζήτηση πρόκειται να διεξαχθεί. Με βάση το αίτημα αναζήτησης, η συσκευή αναζήτησης πολυμέσων ανακτά το περιεχόμενο πολυμέσων από μια βάση δεδομένων πολυμέσων. Η συσκευή αναζήτησης πολυμέσων ανακτά τα πρότυπα, όπως τα γκαουσσιανά πρότυπα μιγμάτων (GMMs), από μια πρότυπη συσκευή αποθήκευσης, που αντιστοιχεί στα στοιχεία ομιλητών και υποβάθρου στόχων. Με βάση τα ανακτημένα πρότυπα, η συσκευή αναζήτησης πολυμέσων ψάχνει τα ακουστικά στοιχεία του περιεχομένου πολυμέσων και τέμνει τα ακουστικά στοιχεία. Τα τμήματα προσδιορίζονται με τον υπολογισμό ενός μέσου ομαλοποιημένου αποτελέσματος για έναν φραγμό των πλαισίων των ακουστικών στοιχείων και τον καθορισμό εάν το μέσο ομαλοποιημένο αποτέλεσμα για το φραγμό των πλαισίων υπερβαίνει ένα ή περισσότερα προκαθορισμένα κατώτατα όρια.