The time-domain harmonic-scaling (tdhs) algorithm provides a computationally efficient method (suitable for real-time implementation) for speech bandwith compression and expansion. Pitch estimation is an important ope...
详细信息
The time-domain harmonic-scaling (tdhs) algorithm provides a computationally efficient method (suitable for real-time implementation) for speech bandwith compression and expansion. Pitch estimation is an important operation in the tdhs process. In the present paper, we study a tdhs/sub-band coding system for speech operating at 16 kbits/s and investigate the relative effectiveness of five different pitch estimation methods (the autocorrelation method, the cepstrum method, the simplified inverse filtering technique, the average magnitude difference function method and the maximum likelihood method). A formal listening test using 17 human listeners is conducted for their comparative performance evaluation. The average magnitude difference function method was found to be the best pitch estimation method for tdhs/sub-band coding. Der algorithms zur tdhs-Zeitkompression (Time-Domain Harmonic Scaling) stelt ein numerisch leistungsfähiges Verfahren zur Bandbreitenkompression und -dehnung dar (er kann in Echtzeit implementiert werden). Die Bestimmung der Grundfrequenz ist eine wichtige Etappe innerhalb des tdhs-Verfahrens. In diesem Beitrag untersuchen ir ein tdhs-Teilbandkodierungsyustem, welches mit 16 kbits/s arbeitet, und vergleichen die Liestungsfähigkeit von fünf Grundfrequenzbestimmungsmethoden (Autokorrelationsmethode, Ceptrummethode, SIFT-Methode, AMDF-Methode, Methode der “Maximum Likelihood”). Ein psychoakustischer Test mit 17 Hörern erlaubt den Vergleich der Leistungsfähigkeit der verschiedenen Methoden. Die AMDF-Methode erwies sich als am besten geeignetes Verfahren im Rahmen eines tdhs-Teilbandkodierungssystems. L'algorithme de transformation d'échelle de fréquence dans le domaine temporel (tdhs) fournit une méthode numériquement efficace (appropriée à une implantation en temps réel) pour la compression et l'expansion de la largeur de la bande fréuentielle de la parole. L'estimation du pitch représente une opération importante de la procédure tdhs. Dans cet ar
暂无评论