[[abstract]]本論文提出一種新的語音特徵強健技術,藉由對語音特徵時間序列之調變頻譜進行正規化,改善雜訊環境下的語音辨識精確度。此方法將語音特徵時間序列之調變頻譜的強度成分(magnitude spectrum),利用廣義對數函數作轉換後,再進行平均值正規化法,最後再以廣義指數函數作反轉換,而得到更新的調變頻譜強度,我們將其命名為廣義對數調變頻譜平均值正規化法(generalized-logarithmic modulation spectrum mean normalization, GLMSMN)。 在資料庫的選擇上,我們採用國際通用AURORA 2連續數字語料庫,其中的語音訊號分別受到各種加成性雜訊與通道效應的影響。從實驗的結果證實,我們提出的GLMSMN操作在MVN特徵上時,和MFCC以及MVN比較在辨識精確度上有明顯的提升,效果與諸多著名的強健性技術(如統計圖正規化法、時序架構正規化法等)並駕齊驅甚至超越之,且其運算簡易,因此十分具有實用價值。[[abstract]]This thesis presents a novel use of the generalized logarithm operation (q-logarithm) in refining the modulation spectrum of speech features for noise-robust speech recognition. The resulting new method, termed generalized logarithmic modulation spectral mean normalization (GLMSMN), equalizes the...
[[abstract]]In this article, we present an effective compensation scheme to improve noise robustness...
[[abstract]]在本篇論文中,我們提出使用小波消噪技術於語音特徵時間序列上,來提升其雜訊強健性,進而提升語音辨識精確度。在提出的方法架構裡, 我們先分別對每一維的語音特徵時間序列做統計值正規化...
[[abstract]]在本論文中,我們主要分析介紹應用於語音辨識中之三種語音特徵表示法:梅爾倒頻譜特徵係數(MFCC)、扭曲型傅立葉轉換之倒頻譜係數(WDFTCC)及珈瑪調倒頻譜係數(GTCC),並...
[[abstract]]在人隨著科技時代的來臨,人們對於科技產品的需求逐漸提高,過去生活上有許多事物都必須依賴遙控器、鍵盤、滑鼠等等的輸入設備。 現今行動通訊、無線網路、智慧型手機等等的技術日益成熟,...
[[abstract]]在本篇論文中,我們提出一個新的語音辨識演算法,用以增強語音辨識雜訊之強健性,本演算法是根據語音特徵序列其頻譜集中在中低頻的前提,進而將受到雜訊干擾的語音特徵序列在強度調變頻譜上...
[[abstract]]自動語音辨識,在實際系統應用中,語音信號經常受到環境雜訊的影響而降低其辨識率。為了提升系統的效能,許多研究語音辨識的學者歷年來不斷地研究語音的強健技術,期望能達到語音辨識系統的...
[[abstract]]在本篇論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音特徵調變頻譜、藉此提升自動語音辨識系統之雜訊強健...
[[abstract]]隨著科技的進步,越來越多的自動化工具出現在人們的生活中。在所有人機器界面中,聲音應該算是最直接也最方便的。雖然現在語音辨識系統在實驗室環境中可以得到良好的辨識率,但在實際生活中...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
[[abstract]]此篇論文分別利用兩種方式強健語音辨識系統,一是結合不同模型之優點對倒頻譜參數降維,二是藉由正規化語音特徵統計特性來降低雜訊造成的影響。 第一部分,結合了線性鑑別分析(l...
В статті запропоновано метод сегментації мовних сигналів на основі аналізу варіації рівня енергії ве...
Gulzowらによりマルチレートシステムを用いたスペクトルサブトラクション法が提案されている.音声認識システムの耐雑音性向上のためにこの手法を前処理として組み込み,音声認識実験を行ったところ広帯域雑音...
[[abstract]]本論文提出一種語音辨識中強化特徵之抗噪性的新方法,在此方法中,我們將語音倒頻譜特徵時間序列藉由線性估測編碼法分解出估測誤差成分後,將此估測誤差成分從原特徵序列扣除,所得的新特徵...
[[abstract]]本論文主要是發展語音特徵強健化技術,來改進雜訊環境下語音辨識的效能。我們改良原始全頻帶序列特徵統計補償技術,使用離散小波轉換來對語音特徵時間序列進行分頻帶的處理,進而發展出兩種...
[[abstract]]在本論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音訊號之聲學頻譜序列的調變頻譜,藉由分別訓練資料中乾...
[[abstract]]In this article, we present an effective compensation scheme to improve noise robustness...
[[abstract]]在本篇論文中,我們提出使用小波消噪技術於語音特徵時間序列上,來提升其雜訊強健性,進而提升語音辨識精確度。在提出的方法架構裡, 我們先分別對每一維的語音特徵時間序列做統計值正規化...
[[abstract]]在本論文中,我們主要分析介紹應用於語音辨識中之三種語音特徵表示法:梅爾倒頻譜特徵係數(MFCC)、扭曲型傅立葉轉換之倒頻譜係數(WDFTCC)及珈瑪調倒頻譜係數(GTCC),並...
[[abstract]]在人隨著科技時代的來臨,人們對於科技產品的需求逐漸提高,過去生活上有許多事物都必須依賴遙控器、鍵盤、滑鼠等等的輸入設備。 現今行動通訊、無線網路、智慧型手機等等的技術日益成熟,...
[[abstract]]在本篇論文中,我們提出一個新的語音辨識演算法,用以增強語音辨識雜訊之強健性,本演算法是根據語音特徵序列其頻譜集中在中低頻的前提,進而將受到雜訊干擾的語音特徵序列在強度調變頻譜上...
[[abstract]]自動語音辨識,在實際系統應用中,語音信號經常受到環境雜訊的影響而降低其辨識率。為了提升系統的效能,許多研究語音辨識的學者歷年來不斷地研究語音的強健技術,期望能達到語音辨識系統的...
[[abstract]]在本篇論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音特徵調變頻譜、藉此提升自動語音辨識系統之雜訊強健...
[[abstract]]隨著科技的進步,越來越多的自動化工具出現在人們的生活中。在所有人機器界面中,聲音應該算是最直接也最方便的。雖然現在語音辨識系統在實驗室環境中可以得到良好的辨識率,但在實際生活中...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
[[abstract]]此篇論文分別利用兩種方式強健語音辨識系統,一是結合不同模型之優點對倒頻譜參數降維,二是藉由正規化語音特徵統計特性來降低雜訊造成的影響。 第一部分,結合了線性鑑別分析(l...
В статті запропоновано метод сегментації мовних сигналів на основі аналізу варіації рівня енергії ве...
Gulzowらによりマルチレートシステムを用いたスペクトルサブトラクション法が提案されている.音声認識システムの耐雑音性向上のためにこの手法を前処理として組み込み,音声認識実験を行ったところ広帯域雑音...
[[abstract]]本論文提出一種語音辨識中強化特徵之抗噪性的新方法,在此方法中,我們將語音倒頻譜特徵時間序列藉由線性估測編碼法分解出估測誤差成分後,將此估測誤差成分從原特徵序列扣除,所得的新特徵...
[[abstract]]本論文主要是發展語音特徵強健化技術,來改進雜訊環境下語音辨識的效能。我們改良原始全頻帶序列特徵統計補償技術,使用離散小波轉換來對語音特徵時間序列進行分頻帶的處理,進而發展出兩種...
[[abstract]]在本論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音訊號之聲學頻譜序列的調變頻譜,藉由分別訓練資料中乾...
[[abstract]]In this article, we present an effective compensation scheme to improve noise robustness...
[[abstract]]在本篇論文中,我們提出使用小波消噪技術於語音特徵時間序列上,來提升其雜訊強健性,進而提升語音辨識精確度。在提出的方法架構裡, 我們先分別對每一維的語音特徵時間序列做統計值正規化...
[[abstract]]在本論文中,我們主要分析介紹應用於語音辨識中之三種語音特徵表示法:梅爾倒頻譜特徵係數(MFCC)、扭曲型傅立葉轉換之倒頻譜係數(WDFTCC)及珈瑪調倒頻譜係數(GTCC),並...