The invention provides a system and method for automatically indexing and
retrieving multimedia content. The method may include separating a
multimedia data stream into audio, visual and text components, segmenting
the audio, visual and text components based on semantic differences,
identifying at least one target speaker using the audio and visual
components, identifying a topic of the multimedia event using the
segmented text and topic category models, generating a summary of the
multimedia event based on the audio, visual and text components, the
identified topic and the identified target speaker, and generating a
multimedia description of the multimedia event based on the identified
target speaker, the identified topic, and the generated summary.
L'invenzione fornisce automaticamente un sistema e un metodo per indexing ed il richiamo del soddisfare di multimedia. Il metodo può includere la separazione del flusso di dati di multimedia nei componenti audio, di rappresentazione e del testo, suddividenti i componenti audio, di rappresentazione e del testo basati sulle differenze semantiche, identificanti almeno un altoparlante dell'obiettivo usando i componenti audio e visivi, identificando un soggetto dell'evento di multimedia usando i modelli segmentati di categoria di soggetto e del testo, generando un sommario dell'evento di multimedia basato sui componenti audio, di rappresentazione e del testo, sul soggetto identificato e sull'altoparlante identificato dell'obiettivo e sulla generazione della descrizione di multimedia dell'evento di multimedia basato sull'altoparlante identificato dell'obiettivo, sul soggetto identificato e sul sommario generato.