[[abstract]]近年來,支援向量機 (Support Vector Machines,SVMs) 在樣式識別與數據挖掘的領域中已被廣泛用於解決各式各樣的分類問題。支援向量機的基本原則在於根據所有訓練樣本的類別標籤找出最佳的超平面,並利用此一超平面預測測試樣本的類別標籤。顯而易見地,基於此一原則所必須付出的計算成本限制了支援向量機對於大規模資料集的訓練能力。為了克服此一缺點,最為直觀的處理方式便是減少與建構最佳超平面無關之訓練樣本的數量。本文中,我們提出一種以最近鄰居搜尋為基礎的有效方法,進而識別出與建構最佳超平面相關的訓練樣本,使得這些樣本在被移除之後不致於影響支援向量機的分類準確性。例如:IRIS、Monks 與 Forest 為本文所提出的方法進行效能評估。我們利用一些公開的資料集實驗結果顯示,本文所提出之方法在訓練樣本所減少的數量、支援向量機所耗用的訓練時間以及分類準確性等方面有非常優異的表現。[[abstract]]Over recent years, support vector machines (SVMs) have been widely used for solving a variety of classification problems in the fields of pattern recognition and data mining applications. One basic principle behind SVMs is to predict the class label of a testing sample by using the optimal hyperplane determined from labeled tr...
[[abstract]]隨著電腦應用日益普及,儲存在電腦的資料呈現爆炸式的成長,如何藉由資料探勘技術從鉅量的原始資料中找出常見的資料排列規則,以作為分析或決策時的參考,成為越來越重要的課題。其中循序樣...
文献や World Wide Web(WWW)等には,既に多数のソフトウェアパターン(以下パターン)が存在する.パターンを用いることにより,分析や設計時に頻繁に生じる問題の解決を効率的に行うことができ...
词语是自然语言处理的最小单位,词语相似度研究在自然语言处理的各个领域占有非常重要的地位,同时作为人工智能领域中一项重要应用,并被广泛应用于信息检索、词义消歧、机器翻译、语音自动摘要、分类和聚类等方面。...
随着近年来信息技术和互联网技术的高速发展,我们进入了大数据时代,海量数据需要强大的计算能力。相似性连接操作作为机器学习、数据库、基因信息学等学科的一个基本操作,如何大幅提高计算速度和计算效率,成为了现...
В данной статье рассматривается проблема вычислительно сложного алгоритма классификации, используем...
計畫編號: NSC99-2221-E343-006執行機構: 南華大學資訊工程學系研究期間: 9908~10007[[abstract]]尋找最接近k 個鄰居(k nearest neighbo...
近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング技術が注目されて...
В работе предложено естественное расширение области использования функции конкурентного сходства на ...
最近鄰居法是一種在機器學習及資料探勘應用上相當常見的演算法。有相當多種方法可以實作最近鄰居法,其中樹狀結構演算法包含k維樹及球樹。球樹搜尋法是一種在高維度資料裡表現相當好的演算法。本工作專注於增進球樹...
[[abstract]]本計劃將研究高雄國際機場之停機門指派作業,目前國內機場機門指派作業大多是以人工方式規劃,包括高雄國際機場,這種作業缺乏系統性的考量,而且會產生兩個主要問題:(1) 作業緩慢,且...
計畫編號: NSC98-2221-E343-008執行機構: 南華大學資訊工程學系研究期間: 9808~9907[[abstract]]PNN(Pairwise-nearest-neighbor...
Представлен новый подход к применению ключевых положений теории распознавания образов при...
围绕传统的协同过滤推荐算法存在的局限性展开研究,提出了一种时间加权不确定近邻的协同过滤推荐算法(time-weighted uncertain nearest neighbor collaborati...
围绕传统的协同过滤推荐算法存在的局限性展开研究,提出一种时间加权不确定近邻协同过滤推荐算法TWUNCF.根据推荐系统应用的实际情况,首先对用户和产品相似度进行时间加权以保证数据有效性,在此基础上改进相...
編輯距離(edit distance) 是一個廣泛地被用於測量字串之間相似程度 的度量,而字串相似度搜尋(string similarity search) 則要找出在特定的字串集合中和給予的查詢字串...
[[abstract]]隨著電腦應用日益普及,儲存在電腦的資料呈現爆炸式的成長,如何藉由資料探勘技術從鉅量的原始資料中找出常見的資料排列規則,以作為分析或決策時的參考,成為越來越重要的課題。其中循序樣...
文献や World Wide Web(WWW)等には,既に多数のソフトウェアパターン(以下パターン)が存在する.パターンを用いることにより,分析や設計時に頻繁に生じる問題の解決を効率的に行うことができ...
词语是自然语言处理的最小单位,词语相似度研究在自然语言处理的各个领域占有非常重要的地位,同时作为人工智能领域中一项重要应用,并被广泛应用于信息检索、词义消歧、机器翻译、语音自动摘要、分类和聚类等方面。...
随着近年来信息技术和互联网技术的高速发展,我们进入了大数据时代,海量数据需要强大的计算能力。相似性连接操作作为机器学习、数据库、基因信息学等学科的一个基本操作,如何大幅提高计算速度和计算效率,成为了现...
В данной статье рассматривается проблема вычислительно сложного алгоритма классификации, используем...
計畫編號: NSC99-2221-E343-006執行機構: 南華大學資訊工程學系研究期間: 9908~10007[[abstract]]尋找最接近k 個鄰居(k nearest neighbo...
近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング技術が注目されて...
В работе предложено естественное расширение области использования функции конкурентного сходства на ...
最近鄰居法是一種在機器學習及資料探勘應用上相當常見的演算法。有相當多種方法可以實作最近鄰居法,其中樹狀結構演算法包含k維樹及球樹。球樹搜尋法是一種在高維度資料裡表現相當好的演算法。本工作專注於增進球樹...
[[abstract]]本計劃將研究高雄國際機場之停機門指派作業,目前國內機場機門指派作業大多是以人工方式規劃,包括高雄國際機場,這種作業缺乏系統性的考量,而且會產生兩個主要問題:(1) 作業緩慢,且...
計畫編號: NSC98-2221-E343-008執行機構: 南華大學資訊工程學系研究期間: 9808~9907[[abstract]]PNN(Pairwise-nearest-neighbor...
Представлен новый подход к применению ключевых положений теории распознавания образов при...
围绕传统的协同过滤推荐算法存在的局限性展开研究,提出了一种时间加权不确定近邻的协同过滤推荐算法(time-weighted uncertain nearest neighbor collaborati...
围绕传统的协同过滤推荐算法存在的局限性展开研究,提出一种时间加权不确定近邻协同过滤推荐算法TWUNCF.根据推荐系统应用的实际情况,首先对用户和产品相似度进行时间加权以保证数据有效性,在此基础上改进相...
編輯距離(edit distance) 是一個廣泛地被用於測量字串之間相似程度 的度量,而字串相似度搜尋(string similarity search) 則要找出在特定的字串集合中和給予的查詢字串...
[[abstract]]隨著電腦應用日益普及,儲存在電腦的資料呈現爆炸式的成長,如何藉由資料探勘技術從鉅量的原始資料中找出常見的資料排列規則,以作為分析或決策時的參考,成為越來越重要的課題。其中循序樣...
文献や World Wide Web(WWW)等には,既に多数のソフトウェアパターン(以下パターン)が存在する.パターンを用いることにより,分析や設計時に頻繁に生じる問題の解決を効率的に行うことができ...
词语是自然语言处理的最小单位,词语相似度研究在自然语言处理的各个领域占有非常重要的地位,同时作为人工智能领域中一项重要应用,并被广泛应用于信息检索、词义消歧、机器翻译、语音自动摘要、分类和聚类等方面。...