A method and apparatus for generating a noise-reduced feature vector
representing human speech are provided. Speech data representing an input
speech waveform are first input and filtered. Spectral energies of the
filtered speech data are determined, and a noise reduction process is then
performed. In the noise reduction process, a spectral magnitude is
computed for a frequency index of multiple frequency indexes. A noise
magnitude estimate is then determined for the frequency index by updating
a histogram of spectral magnitude, and then determining the noise
magnitude estimate as a predetermined percentile of the histogram. A
signal-to-noise ratio is then determined for the frequency index. A scale
factor is computed for the frequency index, as a function of the
signal-to-noise ratio and the noise magnitude estimate. The noise
magnitude estimate is then scaled by the scale factor. The scaled noise
magnitude estimate is subtracted from the spectral magnitudes of the
filtered speech data, to produce cleaned speech data, based on which a
feature vector is generated.
Een methode en een apparaat om een lawaai-verminderde eigenschapvector te produceren die menselijke toespraak vertegenwoordigt worden verstrekt. De gegevens die van de toespraak een golfvorm van de inputtoespraak zijn vertegenwoordigen eerste input en gefiltreerd. De spectrale energieën van de gefiltreerde toespraakgegevens worden bepaald, en een proces van de lawaaivermindering wordt dan uitgevoerd. In het proces van de lawaaivermindering, wordt een spectrale omvang gegevens verwerkt voor een frequentieindex van veelvoudige frequentieindexen. Een raming van de lawaaiomvang wordt dan bepaald voor de frequentieindex door een histogram van spectrale omvang bij te werken, en dan de raming van de lawaaiomvang te bepalen als vooraf bepaalde percentile van de histogram. Een signal-to-noise verhouding wordt dan bepaald voor de frequentieindex. Een schaalfactor wordt gegevens verwerkt voor de frequentieindex, als functie van de signal-to-noise verhouding en de raming van de lawaaiomvang. De raming van de lawaaiomvang wordt dan geschraapt door de schaalfactor. De geschraapte raming van de lawaaiomvang wordt afgetrokken van de spectrale omvang gefiltreerde toespraakgegevens, om schoongemaakte gebaseerde toespraakgegevens, op die te produceren een eigenschapvector wordt geproduceerd.