A system and method for indexing segments of audio/multimedia files and
data streams for storage in a database according to audio information such
as speaker identity, the background environment and channel (music, street
noise, car noise, telephone, studio noise, speech plus music, speech plus
noise, speech over speech), and/or the transcription of the spoken
utterances. The content or topic of the transcribed text can also be
determined using natural language understanding to index based on the
context of the transcription. A user can then retrieve desired segments of
the audio file from the database by generating a query having one or more
desired parameters based on the indexed information.
Een systeem en een methode om segmenten de audio/van verschillende media dossiers en gegevensstromen voor opslag in een gegevensbestand volgens audioinformatie zoals sprekersidentiteit, het achtergrondmilieu en het kanaal (muziek, straatlawaai, autolawaai, telefoon, studiolawaai, toespraak plus muziek, toespraak plus lawaai, toespraak over toespraak), en/of de transcriptie van de gesproken uitingen te indexeren. De inhoud of het onderwerp van de getranscribeerde tekst kan ook worden bepaald gebruikend natuurlijke taal begrip aan index die op de context van de transcriptie wordt gebaseerd. Een gebruiker kan gewenste segmenten van het audiodossier van het gegevensbestand dan terugwinnen door een vraag te produceren die één of meerdere gewenste parameters heeft die op de geïndexeerde informatie worden gebaseerd.