[[abstract]]在本篇論文中,我們提出一個新的語音辨識演算法,用以增強語音辨識雜訊之強健性,本演算法是根據語音特徵序列其頻譜集中在中低頻的前提,進而將受到雜訊干擾的語音特徵序列在強度調變頻譜上做冪次係數上的調整,藉此得到更具強健性或鑑別力的語音特徵時間序列。相較於其他種類的強度調變頻譜更新法,此新方法的主要優點在於,我們不必藉由乾淨調變頻譜做為參考值,即可得到強健度相近的語音特徵。我們將上述提出的新方法運用在國際通用的AURORA-2語音資料庫的實驗上時,藉由不同的動態冪次係數設定,可以使原先之時間序列特徵正規化法得到更好的辨識率。同時,我們將此新方法作用於經過各種統計正規化技術預處理後的特徵上,相對於原單一統計正規化技術而言,能得到更佳的辨識效能,印證了此新方法與其他強健技術優越的加成性。[[abstract]]In this thesis, we present a novel approach to enhancing the speech features in the modulation spectrum for better recognition performance in noise-corrupted environments. In the presented approach, termed modulation spectrum power-law expansion (MSPLE), the speech feature temporal stream is first pre-processed by some statistics compensation technique, such as cepstral mean and va...
[[abstract]]本文嘗試將原始語音嵌入零值音框,再使用雜訊頻譜峰值鎖定的方式估測雜訊,提升語音音框中雜訊頻譜估測的位準,使得增強後的語音,可以有效的移除背景雜訊及改善殘留雜訊過多的缺點。零值音...
语音是最为重要的人机交互手段之一,语音的清晰度是人机交互得以顺利进行的关键,尤其影响着语音识别应用系统的识别性能。因此,研究语音信号增强以提高语音信号的清晰度具有重要的理论与实际应用价值,也是当前语音...
[[abstract]]雜訊干擾的存在造成自動語音辨識系統其發展環境和應用環境兩者之間的不匹配, 進而導致語音辨識精確度不佳。目前處理此問題之技術可粗分為三類: 語音強化、強健性語音特徵參數呈現與語音...
[[abstract]]自動語音辨識,在實際系統應用中,語音信號經常受到環境雜訊的影響而降低其辨識率。為了提升系統的效能,許多研究語音辨識的學者歷年來不斷地研究語音的強健技術,期望能達到語音辨識系統的...
[[abstract]]在本篇論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音特徵調變頻譜、藉此提升自動語音辨識系統之雜訊強健...
[[abstract]]隨著科技的進步,越來越多的自動化工具出現在人們的生活中。在所有人機器界面中,聲音應該算是最直接也最方便的。雖然現在語音辨識系統在實驗室環境中可以得到良好的辨識率,但在實際生活中...
[[abstract]]在人隨著科技時代的來臨,人們對於科技產品的需求逐漸提高,過去生活上有許多事物都必須依賴遙控器、鍵盤、滑鼠等等的輸入設備。 現今行動通訊、無線網路、智慧型手機等等的技術日益成熟,...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
[[abstract]]本論文提出一種新的語音特徵強健技術,藉由對語音特徵時間序列之調變頻譜進行正規化,改善雜訊環境下的語音辨識精確度。此方法將語音特徵時間序列之調變頻譜的強度成分(magnitude...
[[abstract]]一套語音處理與應用系統,常會因為周遭環境的各種干擾因素,例如:加成性雜訊、語者特性變異、傳輸通道不匹配的效應等,使得接收到的語音訊號或其轉換而得的語音特徵產生嚴重失真,進而使得...
[[abstract]]本論文主要是發展語音特徵強健化技術,來改進雜訊環境下語音辨識的效能。我們改良原始全頻帶序列特徵統計補償技術,使用離散小波轉換來對語音特徵時間序列進行分頻帶的處理,進而發展出兩種...
В статті запропоновано метод сегментації мовних сигналів на основі аналізу варіації рівня енергії ве...
Gulzowらによりマルチレートシステムを用いたスペクトルサブトラクション法が提案されている.音声認識システムの耐雑音性向上のためにこの手法を前処理として組み込み,音声認識実験を行ったところ広帯域雑音...
[[abstract]]在本論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音訊號之聲學頻譜序列的調變頻譜,藉由分別訓練資料中乾...
[[abstract]]語音辨識技術在實際應用時,常會受到外在環境的雜訊干擾,使得辨識系統效能經常會下降,常見的語音辨識產品有手持行動電話、語音撥號辨識系統…等,大多數會在噪音干擾嚴重的環境下使用。因...
[[abstract]]本文嘗試將原始語音嵌入零值音框,再使用雜訊頻譜峰值鎖定的方式估測雜訊,提升語音音框中雜訊頻譜估測的位準,使得增強後的語音,可以有效的移除背景雜訊及改善殘留雜訊過多的缺點。零值音...
语音是最为重要的人机交互手段之一,语音的清晰度是人机交互得以顺利进行的关键,尤其影响着语音识别应用系统的识别性能。因此,研究语音信号增强以提高语音信号的清晰度具有重要的理论与实际应用价值,也是当前语音...
[[abstract]]雜訊干擾的存在造成自動語音辨識系統其發展環境和應用環境兩者之間的不匹配, 進而導致語音辨識精確度不佳。目前處理此問題之技術可粗分為三類: 語音強化、強健性語音特徵參數呈現與語音...
[[abstract]]自動語音辨識,在實際系統應用中,語音信號經常受到環境雜訊的影響而降低其辨識率。為了提升系統的效能,許多研究語音辨識的學者歷年來不斷地研究語音的強健技術,期望能達到語音辨識系統的...
[[abstract]]在本篇論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音特徵調變頻譜、藉此提升自動語音辨識系統之雜訊強健...
[[abstract]]隨著科技的進步,越來越多的自動化工具出現在人們的生活中。在所有人機器界面中,聲音應該算是最直接也最方便的。雖然現在語音辨識系統在實驗室環境中可以得到良好的辨識率,但在實際生活中...
[[abstract]]在人隨著科技時代的來臨,人們對於科技產品的需求逐漸提高,過去生活上有許多事物都必須依賴遙控器、鍵盤、滑鼠等等的輸入設備。 現今行動通訊、無線網路、智慧型手機等等的技術日益成熟,...
[[abstract]]隨著科技的發展,自動語音辨識技術也逐漸成熟,而達實際應用的階段;但當一自動語音辨識系統使用於現實環境中時,往往會受到雜訊的干擾,而造成辨識率大幅的下降;因此,環境相關的語音強健...
[[abstract]]本論文提出一種新的語音特徵強健技術,藉由對語音特徵時間序列之調變頻譜進行正規化,改善雜訊環境下的語音辨識精確度。此方法將語音特徵時間序列之調變頻譜的強度成分(magnitude...
[[abstract]]一套語音處理與應用系統,常會因為周遭環境的各種干擾因素,例如:加成性雜訊、語者特性變異、傳輸通道不匹配的效應等,使得接收到的語音訊號或其轉換而得的語音特徵產生嚴重失真,進而使得...
[[abstract]]本論文主要是發展語音特徵強健化技術,來改進雜訊環境下語音辨識的效能。我們改良原始全頻帶序列特徵統計補償技術,使用離散小波轉換來對語音特徵時間序列進行分頻帶的處理,進而發展出兩種...
В статті запропоновано метод сегментації мовних сигналів на основі аналізу варіації рівня енергії ве...
Gulzowらによりマルチレートシステムを用いたスペクトルサブトラクション法が提案されている.音声認識システムの耐雑音性向上のためにこの手法を前処理として組み込み,音声認識実験を行ったところ広帯域雑音...
[[abstract]]在本論文中,我們使用了非負矩陣分解(nonnegative matrix decomposition, NMF)技術來強化語音訊號之聲學頻譜序列的調變頻譜,藉由分別訓練資料中乾...
[[abstract]]語音辨識技術在實際應用時,常會受到外在環境的雜訊干擾,使得辨識系統效能經常會下降,常見的語音辨識產品有手持行動電話、語音撥號辨識系統…等,大多數會在噪音干擾嚴重的環境下使用。因...
[[abstract]]本文嘗試將原始語音嵌入零值音框,再使用雜訊頻譜峰值鎖定的方式估測雜訊,提升語音音框中雜訊頻譜估測的位準,使得增強後的語音,可以有效的移除背景雜訊及改善殘留雜訊過多的缺點。零值音...
语音是最为重要的人机交互手段之一,语音的清晰度是人机交互得以顺利进行的关键,尤其影响着语音识别应用系统的识别性能。因此,研究语音信号增强以提高语音信号的清晰度具有重要的理论与实际应用价值,也是当前语音...
[[abstract]]雜訊干擾的存在造成自動語音辨識系統其發展環境和應用環境兩者之間的不匹配, 進而導致語音辨識精確度不佳。目前處理此問題之技術可粗分為三類: 語音強化、強健性語音特徵參數呈現與語音...