[[abstract]]在本論文中,我們主要分析介紹應用於語音辨識中之三種語音特徵表示法:梅爾倒頻譜特徵係數(MFCC)、扭曲型傅立葉轉換之倒頻譜係數(WDFTCC)及珈瑪調倒頻譜係數(GTCC),並凸顯它們之間的差異,另外,我們將三種語音特徵配合數種特徵強健性技術,觀察它們於乾淨環境與雜訊環境下所得到的辨識率,藉此評估比較三種語音特徵其鑑別力、抗噪性及與它們跟強健演算法搭配的加成性,從Aurora-2數字資料庫的實驗評估結果來看,在不使用強健演算法時,傳統的MFCC表現略優於WDFTCC與GTCC,然而當配合強健演算法使用時,WDFTCC與GTCC這兩種新型特徵相較於MFCC能達到更佳的辨識效果。[[abstract]]In this thesis, we first introduce three types of speech feature representation, including mel-frequency cepstral coefficients (MFCC), warped discrete Fourier transform cepstral coefficients (WDFTCC) and gammatone frequency cepstral coefficients (GTCC). These feature representations primarily differ in the applied filter-bank. Then we perform several noise robustness techniques on the above three types of features to evaluate the c...
Maintaining a high level of robustness for Automatic Speech Recognition (ASR) systems is especially ...
This dissertation introduces a new approach to estimation of the features used in an automatic speec...
[[abstract]]在本篇論文中,我們使用了分負矩陣分解法(nonnegative matrix factorization,NMF)技術來強化語音,藉此提升語音的品質與語音辨識的精確率。以往基於...
[[abstract]]本論文提出一種語音辨識中強化特徵之抗噪性的新方法,在此方法中,我們將語音倒頻譜特徵時間序列藉由線性估測編碼法分解出估測誤差成分後,將此估測誤差成分從原特徵序列扣除,所得的新特徵...
[[abstract]]雜訊干擾的存在造成自動語音辨識系統其發展環境和應用環境兩者之間的不匹配, 進而導致語音辨識精確度不佳。目前處理此問題之技術可粗分為三類: 語音強化、強健性語音特徵參數呈現與語音...
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方...
[[abstract]]在本論文中,我們提出一種新的語音特徵強化技術、用以雜訊環境之下的自動語音辨識。在此新技術中,我們利用了著名的強健主軸分析法(robust principal component...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
本稿では, 騒音環境下におけるRahmonicとメルケプストラム(Mel-Frequency Cepstrum Coefficients: MFCC)を用いた叫び声検出手法について述べる. MFCCは...
[[abstract]]此篇論文分別利用兩種方式強健語音辨識系統,一是結合不同模型之優點對倒頻譜參數降維,二是藉由正規化語音特徵統計特性來降低雜訊造成的影響。 第一部分,結合了線性鑑別分析(l...
隨著語音訊號應用越來越廣泛,語音增強上的雜訊消除演算法種類變化也越來越多。但是隨著雜訊消除或壓抑的程度越大,所伴隨的訊號失真也越來越大。訊號失真的狀況深深影響後續的許多應用。例如:語音辨識。本論文研究...
[[abstract]]此篇論文提出一個針對噪音環境下的強健性語音辨識技術,我們將此一技術應用於語音辨識系統中,此辨識系統使用模擬二維倒頻譜(Modified two-dimension cepstr...
介绍一种平稳噪声环境下语音识别的新的方法.该方法利用噪声的LPC系数去预测语音信号 , 从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和 在合适的匹配方式下的识别....
This dissertation introduces a new approach to estimation of the features used in an automatic speec...
Many new consumer applications are based on the use of automatic speech recognition (ASR) systems, s...
Maintaining a high level of robustness for Automatic Speech Recognition (ASR) systems is especially ...
This dissertation introduces a new approach to estimation of the features used in an automatic speec...
[[abstract]]在本篇論文中,我們使用了分負矩陣分解法(nonnegative matrix factorization,NMF)技術來強化語音,藉此提升語音的品質與語音辨識的精確率。以往基於...
[[abstract]]本論文提出一種語音辨識中強化特徵之抗噪性的新方法,在此方法中,我們將語音倒頻譜特徵時間序列藉由線性估測編碼法分解出估測誤差成分後,將此估測誤差成分從原特徵序列扣除,所得的新特徵...
[[abstract]]雜訊干擾的存在造成自動語音辨識系統其發展環境和應用環境兩者之間的不匹配, 進而導致語音辨識精確度不佳。目前處理此問題之技術可粗分為三類: 語音強化、強健性語音特徵參數呈現與語音...
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方...
[[abstract]]在本論文中,我們提出一種新的語音特徵強化技術、用以雜訊環境之下的自動語音辨識。在此新技術中,我們利用了著名的強健主軸分析法(robust principal component...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
本稿では, 騒音環境下におけるRahmonicとメルケプストラム(Mel-Frequency Cepstrum Coefficients: MFCC)を用いた叫び声検出手法について述べる. MFCCは...
[[abstract]]此篇論文分別利用兩種方式強健語音辨識系統,一是結合不同模型之優點對倒頻譜參數降維,二是藉由正規化語音特徵統計特性來降低雜訊造成的影響。 第一部分,結合了線性鑑別分析(l...
隨著語音訊號應用越來越廣泛,語音增強上的雜訊消除演算法種類變化也越來越多。但是隨著雜訊消除或壓抑的程度越大,所伴隨的訊號失真也越來越大。訊號失真的狀況深深影響後續的許多應用。例如:語音辨識。本論文研究...
[[abstract]]此篇論文提出一個針對噪音環境下的強健性語音辨識技術,我們將此一技術應用於語音辨識系統中,此辨識系統使用模擬二維倒頻譜(Modified two-dimension cepstr...
介绍一种平稳噪声环境下语音识别的新的方法.该方法利用噪声的LPC系数去预测语音信号 , 从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和 在合适的匹配方式下的识别....
This dissertation introduces a new approach to estimation of the features used in an automatic speec...
Many new consumer applications are based on the use of automatic speech recognition (ASR) systems, s...
Maintaining a high level of robustness for Automatic Speech Recognition (ASR) systems is especially ...
This dissertation introduces a new approach to estimation of the features used in an automatic speec...
[[abstract]]在本篇論文中,我們使用了分負矩陣分解法(nonnegative matrix factorization,NMF)技術來強化語音,藉此提升語音的品質與語音辨識的精確率。以往基於...