大規模線性分類器在文件分類以及計算語言學的領域上受到廣泛的運用。一次正規化的線性分類器則可以應用在特徵選擇上,然而其不可微分的性質卻造成求解時諸多困難。近幾年,各種求解一次正規化線性分類問題的最佳化方法相繼被提出,而至今卻並未受到嚴謹地討論與比較。本論文嚴格地探討一些具代表性的方法與實作上的相關議題,並且透過實驗進行徹底地比較。實驗結果顯示出:座標下降法在一般的狀況下,是最適合用來求解一次正規化線性分類問題的最佳化方法;然而,以牛頓法為基礎的最佳化方法則在求解後期能有最快速的收斂特性。A large-scale linear classifier is useful for document classification and computational linguistics. The L1-regularized form can be used for feature selection, but its non-differentiability causes more difficulties in training. Various optimization methods have been proposed in recent years, but no serious comparison among them has been made. In this paper, we carefully address implementation issues of some representative methods and conduct a comprehensive comparison. Results show that coordinate de...
本研究提出兩點分段適應近似法應用於結構最佳化上。為使數學最佳化理論能與結構設計結合,必須透過近似法將結構之行為諸如應力、位移、頻率等轉換成以設計變數表示的顯函數。最佳解便能透過解決數個由近似函數構成的...
The lasso algorithm for variable selection in linear models, introduced by Tibshirani, works by imp...
Engineering computer codes are often compu- tationally expensive. To lighten this load, we exploit n...
邏輯迴歸是一種常被應用在文件分類與計算語言學上的技術。L1 正規化的邏輯迴歸可被視為一種特徵選取的方式,然而它不可微分的特性增加了問題的困難度。近年來有多種最佳化方法被用在解決這個問題上,但這些方法彼...
支持向量機常使用非線性映射函數將資料點映到高維度空間,以便於將非線性分布的資料點分類。核心函數則可以解決映射到高維度空間之後的資料向量有過多特徵而難以訓練的問題。然而,在大規模資料上訓練支持向量機所需...
在分類問題中,如果少量資料被新增或移除,增量和減量式技術可以快速更新模型。然而,增量和減量式演算法的設計需要很多方面的考量。在本論文中,主要探討線性分類問題,包括邏輯回歸與線性支持向量機。我們將暖啟動...
近幾年來,線性分類器在大規模資料分類問題上有良好的發展與表現。然而,實際上仍存在著兩個重要的議題尚未被解決。第一個問題是現實生活中所收集到的資料有很大部分是沒有辦法被線性分類器所解釋,如果線性分類器將...
一個社會經濟學的目標變量,經常存在兩種不同收集頻率的數據。由於較低頻率的一組數據通常由大型普查中所獲得,其準確度及可靠性會較高。因此較低頻率的一組數據一般會視作基準,用作對頻率較高的另一組數據進行修正...
平滑方法是全局优化的一种启发式方法,在分子构像优化问题中得到大量应用.扩散方程法和邻域平均法是平滑方法的两种实现方式.在一维情况下给出了邻域平均法的性质,通过数值实验比较了两种方法的性能.对类似Gri...
本論文的研究目標是建構一個由多標記複合成的最佳疾病診斷工具,所考慮的評估準則為操作者特徵曲線在特定特異度範圍之線下面積(pAUC)。在常態分布假設下,我們推導多標記線性組合之pAUC以及最佳線性組合之...
Chuhai A. M. Application of parallel calculations in large scale optimization problems / A. M. Chuha...
本研究主要目的是要呈現一個新的流形分析降維方法,透過分析得到原始地圖的每一點之間的距離矩陣後,誤差最小法是透過最小化變形地圖的與原始地圖的距離矩陣誤差,在低維空間去建構新的變形座標矩陣,若是誤差趨近於...
Adaptive regularized framework using cubics has emerged as an alternative to line-search and trust-r...
P(論文)This paper presents an effective algorithm for solving a large-scale linear program. In a linea...
一般化縮減梯度(Generalized Reduced Gradient)法是一個廣受喜愛的非線性規劃問題解法,但於具有四次目標式的多目標統計優化(Statistical Multi-objectiv...
本研究提出兩點分段適應近似法應用於結構最佳化上。為使數學最佳化理論能與結構設計結合,必須透過近似法將結構之行為諸如應力、位移、頻率等轉換成以設計變數表示的顯函數。最佳解便能透過解決數個由近似函數構成的...
The lasso algorithm for variable selection in linear models, introduced by Tibshirani, works by imp...
Engineering computer codes are often compu- tationally expensive. To lighten this load, we exploit n...
邏輯迴歸是一種常被應用在文件分類與計算語言學上的技術。L1 正規化的邏輯迴歸可被視為一種特徵選取的方式,然而它不可微分的特性增加了問題的困難度。近年來有多種最佳化方法被用在解決這個問題上,但這些方法彼...
支持向量機常使用非線性映射函數將資料點映到高維度空間,以便於將非線性分布的資料點分類。核心函數則可以解決映射到高維度空間之後的資料向量有過多特徵而難以訓練的問題。然而,在大規模資料上訓練支持向量機所需...
在分類問題中,如果少量資料被新增或移除,增量和減量式技術可以快速更新模型。然而,增量和減量式演算法的設計需要很多方面的考量。在本論文中,主要探討線性分類問題,包括邏輯回歸與線性支持向量機。我們將暖啟動...
近幾年來,線性分類器在大規模資料分類問題上有良好的發展與表現。然而,實際上仍存在著兩個重要的議題尚未被解決。第一個問題是現實生活中所收集到的資料有很大部分是沒有辦法被線性分類器所解釋,如果線性分類器將...
一個社會經濟學的目標變量,經常存在兩種不同收集頻率的數據。由於較低頻率的一組數據通常由大型普查中所獲得,其準確度及可靠性會較高。因此較低頻率的一組數據一般會視作基準,用作對頻率較高的另一組數據進行修正...
平滑方法是全局优化的一种启发式方法,在分子构像优化问题中得到大量应用.扩散方程法和邻域平均法是平滑方法的两种实现方式.在一维情况下给出了邻域平均法的性质,通过数值实验比较了两种方法的性能.对类似Gri...
本論文的研究目標是建構一個由多標記複合成的最佳疾病診斷工具,所考慮的評估準則為操作者特徵曲線在特定特異度範圍之線下面積(pAUC)。在常態分布假設下,我們推導多標記線性組合之pAUC以及最佳線性組合之...
Chuhai A. M. Application of parallel calculations in large scale optimization problems / A. M. Chuha...
本研究主要目的是要呈現一個新的流形分析降維方法,透過分析得到原始地圖的每一點之間的距離矩陣後,誤差最小法是透過最小化變形地圖的與原始地圖的距離矩陣誤差,在低維空間去建構新的變形座標矩陣,若是誤差趨近於...
Adaptive regularized framework using cubics has emerged as an alternative to line-search and trust-r...
P(論文)This paper presents an effective algorithm for solving a large-scale linear program. In a linea...
一般化縮減梯度(Generalized Reduced Gradient)法是一個廣受喜愛的非線性規劃問題解法,但於具有四次目標式的多目標統計優化(Statistical Multi-objectiv...
本研究提出兩點分段適應近似法應用於結構最佳化上。為使數學最佳化理論能與結構設計結合,必須透過近似法將結構之行為諸如應力、位移、頻率等轉換成以設計變數表示的顯函數。最佳解便能透過解決數個由近似函數構成的...
The lasso algorithm for variable selection in linear models, introduced by Tibshirani, works by imp...
Engineering computer codes are often compu- tationally expensive. To lighten this load, we exploit n...