在本計劃中,針對音訊訊號的遮 罩效應 (masking effect) 進行研究,提出 一個新的後遮罩 (forward masking effect) 的模型,應用在音訊壓縮音質的改善 上。這個模型利用了人耳音訊系統中 接收感應器與神經刺激的效應,這些 效應通常在心理聲音學中後遮罩的原 因。其中,人耳中的非線性效應我們 以一個非線性電路的差分方程式來建 立模型。我們將這個模型加入MPEG Layer III 音訊壓縮架構當中的遮罩效 應,建立在時間頻率空間中的遮罩曲 面。加入這個模型我們可以在相同壓 縮比下得到比較好的音訊音質。在我 們的實驗中,主觀與客觀的音質測試 顯示我們可以比MPEG Layer III 的音訊 壓縮減少12%到25%所需的位元數。This paper presents a new forward masking model for perceptual audio coding. This model exploits adaptation of the peripheral sensory and neural elements in the auditory system, which is often deemed as the cause of forward masking. Nonlinearity of the ear is modeled by a nonlinear analog circuit with difference equations. We incorporate this model in the MPEG Layer III audio coding scheme and construct a masking p...
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方...
[[abstract]]在數位娛樂產業中,接近真實感受的介面逐漸被開發,更多型態的操控介面被提出和應用於數位娛樂產業中。過往因正確率過低無法實用的語音介面也因技術和操控性提升漸漸導入數位娛樂產業。語音...
Рассмотрена новая технология сжатия речевых данных с использованием субполосного преобразования, раз...
[[abstract]]摘 要 語音編碼的目的,是要將語音的類比訊號以數位方式表示,便於做數位的儲 存與傳輸。本論文主要是針對語音編碼在像網路電話的軟體下,探討編解碼的演 算法和程式的流程,並分析語音...
隨著語音訊號應用越來越廣泛,語音增強上的雜訊消除演算法種類變化也越來越多。但是隨著雜訊消除或壓抑的程度越大,所伴隨的訊號失真也越來越大。訊號失真的狀況深深影響後續的許多應用。例如:語音辨識。本論文研究...
Copyright notice. c1990 IEICE All rights reserved. 「2次元空間スペクトルとニュ-ラルネットワ-クを用いた手書き文字の筆者認識」長谷川孝明, 津田則,...
利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法.研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数.考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量...
Copyright notice. c1992 IEICE All rights reserved. 「自己組織化特徴写像を用いた音声の極低ビットレート擬音韻符号化システム」塙 雅典,長谷川 孝明著,...
Vrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siet...
Background work in various levels of speech coding is reviewed, including unconstrained coding and r...
本論文では,ニューラルネットワークを用いた表情認識方式を提案する.特定の1人の顔の四つの表情の認識実験を行い,特にニューラルネットワークの構成法について検討し,提案する方式が有効であることを示す.Co...
人間のもつ個人識別機能のうちの筆者認識機能を工学的に実現するために,特徴量として2次元空間スペクトルを用い,ニューラルネットワークで認識する筆者認識システムを提案し,その有効性を示している.Copyr...
[[abstract]]語音辨識技術在實際應用時,常會受到外在環境的雜訊干擾,使得辨識系統效能經常會下降,常見的語音辨識產品有手持行動電話、語音撥號辨識系統…等,大多數會在噪音干擾嚴重的環境下使用。因...
音声信号の統計的性質を考慮して,自己組織化特徴写像を用いて音声を極低ビットレート符号化する音声符号化システムを提案し,その有効性について述べている.Copyright notice. c1992 IE...
介绍一种平稳噪声环境下语音识别的新的方法.该方法利用噪声的LPC系数去预测语音信号 , 从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和 在合适的匹配方式下的识别....
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方...
[[abstract]]在數位娛樂產業中,接近真實感受的介面逐漸被開發,更多型態的操控介面被提出和應用於數位娛樂產業中。過往因正確率過低無法實用的語音介面也因技術和操控性提升漸漸導入數位娛樂產業。語音...
Рассмотрена новая технология сжатия речевых данных с использованием субполосного преобразования, раз...
[[abstract]]摘 要 語音編碼的目的,是要將語音的類比訊號以數位方式表示,便於做數位的儲 存與傳輸。本論文主要是針對語音編碼在像網路電話的軟體下,探討編解碼的演 算法和程式的流程,並分析語音...
隨著語音訊號應用越來越廣泛,語音增強上的雜訊消除演算法種類變化也越來越多。但是隨著雜訊消除或壓抑的程度越大,所伴隨的訊號失真也越來越大。訊號失真的狀況深深影響後續的許多應用。例如:語音辨識。本論文研究...
Copyright notice. c1990 IEICE All rights reserved. 「2次元空間スペクトルとニュ-ラルネットワ-クを用いた手書き文字の筆者認識」長谷川孝明, 津田則,...
利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法.研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数.考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量...
Copyright notice. c1992 IEICE All rights reserved. 「自己組織化特徴写像を用いた音声の極低ビットレート擬音韻符号化システム」塙 雅典,長谷川 孝明著,...
Vrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siet...
Background work in various levels of speech coding is reviewed, including unconstrained coding and r...
本論文では,ニューラルネットワークを用いた表情認識方式を提案する.特定の1人の顔の四つの表情の認識実験を行い,特にニューラルネットワークの構成法について検討し,提案する方式が有効であることを示す.Co...
人間のもつ個人識別機能のうちの筆者認識機能を工学的に実現するために,特徴量として2次元空間スペクトルを用い,ニューラルネットワークで認識する筆者認識システムを提案し,その有効性を示している.Copyr...
[[abstract]]語音辨識技術在實際應用時,常會受到外在環境的雜訊干擾,使得辨識系統效能經常會下降,常見的語音辨識產品有手持行動電話、語音撥號辨識系統…等,大多數會在噪音干擾嚴重的環境下使用。因...
音声信号の統計的性質を考慮して,自己組織化特徴写像を用いて音声を極低ビットレート符号化する音声符号化システムを提案し,その有効性について述べている.Copyright notice. c1992 IE...
介绍一种平稳噪声环境下语音识别的新的方法.该方法利用噪声的LPC系数去预测语音信号 , 从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和 在合适的匹配方式下的识别....
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方...
[[abstract]]在數位娛樂產業中,接近真實感受的介面逐漸被開發,更多型態的操控介面被提出和應用於數位娛樂產業中。過往因正確率過低無法實用的語音介面也因技術和操控性提升漸漸導入數位娛樂產業。語音...
Рассмотрена новая технология сжатия речевых данных с использованием субполосного преобразования, раз...