本論文主要是討論一系列使用RBF類神經網路 (Radial Basis Function Networks) 在機器學習 (Machine Learning) 領域的研究。 論文的第一個部分討論到如何用正規化程序 (regularization procedure) 有效率的建立一個RBF類神經網路。其中有兩個重要的問題,第一個問題是如何決定核心函數 (kernel function) 的個數與位置。第二個問題是如何決定核心函數組合成RBF類神經網路的權重。在這個論文,我用隨機與遞增式學習兩種方法來決定核心函數的位置,然後用正規化方法與 Cholesky 分解來決定各個核心函數的權重。實驗結果顯示這篇論文所使用的方法可以使用在機器學習與生物資訊領域,而且獲得不錯的結果。 第二個部分討論到一個新的核心密度預測 (kernel density estimation) 的演算法跟他的應用。這個演算法稱為 RVKDE (relaxed variable kernel density estimation) 是由我們實驗室團隊在近期所提出,並應用在許多方面,而我把他拿來應用在機器學習領域的兩個題目上,構成了這個論文的第二部分。This thesis reports a series of studies on machine learning with the radial basis function network (RBFN). The first part of this thesis discusses how to construct an RBFN efficiently with the regularization procedure. In fact, const...
在本篇論文的第一部份,我們探討可逆變異長度編碼在遭遇編碼資料發生 錯誤下的解碼特性。我們提出一個可以分析變異長度編碼的正向解碼錯誤偵測 與正向解碼錯誤回復特性的數學模型。透過此數學模型,我們推導出描述...
如何有效地管理大量、精細且快速累積的串流資料(data streams)對於以 分析靜態資料為主的資訊勘測是一項新的挑戰。傳統的分類(classifiers)主要功能在於自資料中分析出不變的(stat...
為了在高維度、高資料量的資料中找到相似的資料,將每一筆資料 以一串二元訊號表示是近幾年相當流行的一種作法。如此一來,我們 可以大大地壓縮需要表示每筆資料的儲存空間,更重要的是,當我們 在搜尋相近的資料...
Recent modern data set, such as genomic data and image data, often generate huge amount of informati...
這個研究的動機來自於將微陣列實驗(microarray experiment)所得到之基因表現值正規化(normalization), 我們考慮具有基因與區塊(block)二個因子(factor)的實...
在這篇論文中,我們提出了「稀疏隨機特徵近似—希伯特空間下的座標下降法」(Sparse Random Feature Algorithm as Coordinate Descent in Hilbert...
多標籤分類 (multi-label classification) 在機器學習的領域上是一項重要的課題。 目前已經有數種解決方法被提出。在本篇論文中,我們探討以支持向量機 (Support Vect...
通常收集有標記的資料所耗費的成本是高昂的. 而另一方面, 有時候 我們在相關領域會擁有較多的標記資料. 如果沒有足夠的訓練資料, 一 些分類器如最鄰近結點演算法(kNN) 或者支持向量機(SVM) 就...
학위논문 (석사)-- 서울대학교 대학원 : 공과대학 건설환경공학부, 2018. 2. 송준호.Degradation and obsolescence of structures shows ...
結構方程模型(structural equation modeling,簡稱SEM)乃心理學研究常用之多變量統計方法。在SEM的架構下,研究者可根據現有的心理學理論建立假設模型,並檢驗該模型之適切性;...
情緒在人際溝通上與服務的提供上,是個常被遺忘的對象;但近年來由於溝通互動和個人化服務的迅速發展,情緒漸漸的被視為一個考慮、討論以及研究的對象。在心理學以及哲學的領域中,情緒算是較早被提出和被研究的,一...
本論文的主要貢獻在於提出一個基於主題分析的語言模型調適法,這個方法主要是使用潛藏狄式配置(Latent Dirichlet Allocation, LDA)。我們使用機率式潛藏語意分析(Probabi...
近年來關於遠距教學和訓練之進化可以根據一些特性分為遠距學習(d-Learning)、數位學習(e-Learning)以及行動學習(m-Learning)。 本篇論文主要是研究如何利用SVG和J...
本篇論文提供了一種針對分配估計演算法解排列問題之模型適應方 法。分配估計演算法為演化式計算中的一支,特徵在於以機率模型表 示問題解與問題解中變數間的相依關係,同時也因其能解決廣泛的問 題而為人所知。但...
本論文主要分為兩部分。在第一部份中,著重於利用編碼(coding)找出一個低維線性分類子空間(low-dimensional linear discriminant feature subspace)...
在本篇論文的第一部份,我們探討可逆變異長度編碼在遭遇編碼資料發生 錯誤下的解碼特性。我們提出一個可以分析變異長度編碼的正向解碼錯誤偵測 與正向解碼錯誤回復特性的數學模型。透過此數學模型,我們推導出描述...
如何有效地管理大量、精細且快速累積的串流資料(data streams)對於以 分析靜態資料為主的資訊勘測是一項新的挑戰。傳統的分類(classifiers)主要功能在於自資料中分析出不變的(stat...
為了在高維度、高資料量的資料中找到相似的資料,將每一筆資料 以一串二元訊號表示是近幾年相當流行的一種作法。如此一來,我們 可以大大地壓縮需要表示每筆資料的儲存空間,更重要的是,當我們 在搜尋相近的資料...
Recent modern data set, such as genomic data and image data, often generate huge amount of informati...
這個研究的動機來自於將微陣列實驗(microarray experiment)所得到之基因表現值正規化(normalization), 我們考慮具有基因與區塊(block)二個因子(factor)的實...
在這篇論文中,我們提出了「稀疏隨機特徵近似—希伯特空間下的座標下降法」(Sparse Random Feature Algorithm as Coordinate Descent in Hilbert...
多標籤分類 (multi-label classification) 在機器學習的領域上是一項重要的課題。 目前已經有數種解決方法被提出。在本篇論文中,我們探討以支持向量機 (Support Vect...
通常收集有標記的資料所耗費的成本是高昂的. 而另一方面, 有時候 我們在相關領域會擁有較多的標記資料. 如果沒有足夠的訓練資料, 一 些分類器如最鄰近結點演算法(kNN) 或者支持向量機(SVM) 就...
학위논문 (석사)-- 서울대학교 대학원 : 공과대학 건설환경공학부, 2018. 2. 송준호.Degradation and obsolescence of structures shows ...
結構方程模型(structural equation modeling,簡稱SEM)乃心理學研究常用之多變量統計方法。在SEM的架構下,研究者可根據現有的心理學理論建立假設模型,並檢驗該模型之適切性;...
情緒在人際溝通上與服務的提供上,是個常被遺忘的對象;但近年來由於溝通互動和個人化服務的迅速發展,情緒漸漸的被視為一個考慮、討論以及研究的對象。在心理學以及哲學的領域中,情緒算是較早被提出和被研究的,一...
本論文的主要貢獻在於提出一個基於主題分析的語言模型調適法,這個方法主要是使用潛藏狄式配置(Latent Dirichlet Allocation, LDA)。我們使用機率式潛藏語意分析(Probabi...
近年來關於遠距教學和訓練之進化可以根據一些特性分為遠距學習(d-Learning)、數位學習(e-Learning)以及行動學習(m-Learning)。 本篇論文主要是研究如何利用SVG和J...
本篇論文提供了一種針對分配估計演算法解排列問題之模型適應方 法。分配估計演算法為演化式計算中的一支,特徵在於以機率模型表 示問題解與問題解中變數間的相依關係,同時也因其能解決廣泛的問 題而為人所知。但...
本論文主要分為兩部分。在第一部份中,著重於利用編碼(coding)找出一個低維線性分類子空間(low-dimensional linear discriminant feature subspace)...
在本篇論文的第一部份,我們探討可逆變異長度編碼在遭遇編碼資料發生 錯誤下的解碼特性。我們提出一個可以分析變異長度編碼的正向解碼錯誤偵測 與正向解碼錯誤回復特性的數學模型。透過此數學模型,我們推導出描述...
如何有效地管理大量、精細且快速累積的串流資料(data streams)對於以 分析靜態資料為主的資訊勘測是一項新的挑戰。傳統的分類(classifiers)主要功能在於自資料中分析出不變的(stat...
為了在高維度、高資料量的資料中找到相似的資料,將每一筆資料 以一串二元訊號表示是近幾年相當流行的一種作法。如此一來,我們 可以大大地壓縮需要表示每筆資料的儲存空間,更重要的是,當我們 在搜尋相近的資料...