A speech/music discriminator employs data from multiple features of an
audio signal as input to a classifier. Some of the feature data is
determined from individual frames of the audio signal, and other input
data is based upon variations of a feature over several frames, to
distinguish the changes in voiced and unvoiced components of speech from
the more constant characteristics of music. Several different types of
classifiers for labeling test points on the basis of the feature data are
disclosed. A preferred set of classifiers is based upon variations of a
nearest-neighbor approach, including a K-d tree spatial partitioning
technique.
Ein speech/music Unterscheidender setzt Daten von den mehrfachen Eigenschaften eines Audiosignals als Eingang zu einem Klassifikator ein. Einige der Eigenschaft Daten wird von den einzelnen Rahmen des Audiosignals festgestellt, und andere Eingang Daten basieren nach Veränderungen einer Eigenschaft über einigen Rahmen, um die Änderungen, in geäußert, zu unterscheiden und unvoiced Bestandteile der Rede von den konstanteren Eigenschaften von Musik. Einige unterschiedliche Arten Klassifikatoren für beschriftende Prüfpunkte auf der Grundlage von die Eigenschaft Daten werden freigegeben. Ein bevorzugter Satz Klassifikatoren basiert nach Veränderungen einer Nahnachbar Annäherung, einschließlich eine räumliche verteilende Technik des K-d Baums.