隨著資料維度以及資料量增加,以全部資料維度為主的分群方法仍有很大的改善空間。因此,近來子空間分群的方法愈來愈受到重視。在本篇論文中,我們提出一個創新的子空間探勘方法,它同時能看到所有頻繁子空間的全貌。我們所提出的方法包括三個步驟。首先,我們將所有的資料點投影到二維空間,並產生許多頻繁子空間;然後,我們將這些頻繁子空間結合,形成更大的頻繁子空間;最後,我們採用貪婪演算法做總結,從所產生的所有頻繁子空間中選出重要的子空間。實驗結果顯示,我們提出的方法在品質和涵蓋率方面,皆優於FIRES和DUSC這兩個方法。As both the number of dimensions and the amount of data increase, existing clustering methods in the full feature space are not good enough to cluster the data in databases. Thus, the subspace clustering has attracted more and more attention recently. In this thesis, we proposed a novel subspace mining method which can simultaneously consider all frequent subspaces to select the significant subspaces. The proposed method consists of three phases. First, we project all data points onto each p...
目前,已有許多學者提出探勘頻繁一維區間樣式的方法。但是,在實務上,有許多的資料是多維度的區間,如醫學療程分析中的收縮壓、舒張壓、脈博等等。因此,在本篇論文中,我們提出一個名為「MIAMI」的演算法,以...
[[abstract]]本研究針對大型交易資料庫的關聯規則探勘,發展了一套有效率的分散式探勘系統-EDAMS (An efficient distributed association rules m...
卒業論文text近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング...
隨著影音設備、數位相機、網路的盛行,多媒體資料系統也變得愈來愈受歡迎。因此,如何從一個影片資料庫中找出頻繁樣式越來越受到矚目。在本篇論文中,我們提出了一個有效率的探勘演算法「FVP-Miner」,用來...
在本篇論文中,我們提出一個新的空間資料探勘演算法「9DSPA-Miner」。從一個所有影像都是用9D-SPA表示法呈現的影像資料庫中去探勘出空間關聯規則。我們提出的方法包含了三個階段。第一階段,掃瞄資...
由於資訊的進步,在影像資料庫中累積了大量的影像。如何從這些影像中探勘出有價值的資訊,也越來越受到重視。因此,在本篇論文中我們提出一個有效率的探勘演算法——「CP9」,以找尋9DLT影像資料庫中封閉性樣...
在這篇論文中,我們結合了資料探戡和影像處理技術,協助我們找出影像中所隱藏的空間關係與資訊。為了找出這些資訊,我們提出一個影像探戡的架構:空間關聯法則,所謂空間關聯法則是用來描述影像中某個位置的內容與另...
在這個資訊快速擴張的時代,許多種類的資料庫被應用在各式各樣的領域中。空間資料探勘即是一個例子,它在空間資料庫中探勘出頻繁的樣式以及空間關係。空間資料探勘是在空間資料庫中挖掘出有趣的、以前不知道的、但實...
資料發掘目前在傳統關聯式資料庫相關議題上已有不少研究,但如果能再整合空間和時間要素進來,將可從資料中發掘出更明確、更具體的知識。以往常使用統計分析方法來分析空間資料,不幸的是,統計分析方法仍有許多問題...
本論文提出三個探勘移動軌跡樣式的演算法: GBM、 FTM 及LTM。GBM 尋找由空間中連續的格點組成的樣式,而格點間的時間延遲則由時間間隔代表。FTM 探勘彈性移動軌跡樣式,其中樣式的格點不一定要...
隨著定位科技的日益普及,我們可以蒐集到大量的空間資料。因此,如何從空間資料庫中探勘出有意義的頻繁空間樣式,成為越來越熱門的研究議題。藉由資料探勘的技術,可以幫助我們在空間資料庫中發現封閉性的數值樣式,...
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低.讨论了利用MapReduce对这类数据集进行并行聚类的方法,提...
碩士資訊工程學系[[abstract]]分群法(clustering)及關聯性法則探勘(association rules mining)是資料探勘領域中兩種重要的方法。分群法主要用來分析尚未整理以及...
Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目...
[[abstract]]網頁探勘(Web Mining)是資料探勘(DataMining)中的一個領域,他將全球資訊網中相關原始資料進一步整理並運用資料探勘的方法,以得到有用的資訊。我們已運用隨機過程...
目前,已有許多學者提出探勘頻繁一維區間樣式的方法。但是,在實務上,有許多的資料是多維度的區間,如醫學療程分析中的收縮壓、舒張壓、脈博等等。因此,在本篇論文中,我們提出一個名為「MIAMI」的演算法,以...
[[abstract]]本研究針對大型交易資料庫的關聯規則探勘,發展了一套有效率的分散式探勘系統-EDAMS (An efficient distributed association rules m...
卒業論文text近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング...
隨著影音設備、數位相機、網路的盛行,多媒體資料系統也變得愈來愈受歡迎。因此,如何從一個影片資料庫中找出頻繁樣式越來越受到矚目。在本篇論文中,我們提出了一個有效率的探勘演算法「FVP-Miner」,用來...
在本篇論文中,我們提出一個新的空間資料探勘演算法「9DSPA-Miner」。從一個所有影像都是用9D-SPA表示法呈現的影像資料庫中去探勘出空間關聯規則。我們提出的方法包含了三個階段。第一階段,掃瞄資...
由於資訊的進步,在影像資料庫中累積了大量的影像。如何從這些影像中探勘出有價值的資訊,也越來越受到重視。因此,在本篇論文中我們提出一個有效率的探勘演算法——「CP9」,以找尋9DLT影像資料庫中封閉性樣...
在這篇論文中,我們結合了資料探戡和影像處理技術,協助我們找出影像中所隱藏的空間關係與資訊。為了找出這些資訊,我們提出一個影像探戡的架構:空間關聯法則,所謂空間關聯法則是用來描述影像中某個位置的內容與另...
在這個資訊快速擴張的時代,許多種類的資料庫被應用在各式各樣的領域中。空間資料探勘即是一個例子,它在空間資料庫中探勘出頻繁的樣式以及空間關係。空間資料探勘是在空間資料庫中挖掘出有趣的、以前不知道的、但實...
資料發掘目前在傳統關聯式資料庫相關議題上已有不少研究,但如果能再整合空間和時間要素進來,將可從資料中發掘出更明確、更具體的知識。以往常使用統計分析方法來分析空間資料,不幸的是,統計分析方法仍有許多問題...
本論文提出三個探勘移動軌跡樣式的演算法: GBM、 FTM 及LTM。GBM 尋找由空間中連續的格點組成的樣式,而格點間的時間延遲則由時間間隔代表。FTM 探勘彈性移動軌跡樣式,其中樣式的格點不一定要...
隨著定位科技的日益普及,我們可以蒐集到大量的空間資料。因此,如何從空間資料庫中探勘出有意義的頻繁空間樣式,成為越來越熱門的研究議題。藉由資料探勘的技術,可以幫助我們在空間資料庫中發現封閉性的數值樣式,...
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低.讨论了利用MapReduce对这类数据集进行并行聚类的方法,提...
碩士資訊工程學系[[abstract]]分群法(clustering)及關聯性法則探勘(association rules mining)是資料探勘領域中兩種重要的方法。分群法主要用來分析尚未整理以及...
Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目...
[[abstract]]網頁探勘(Web Mining)是資料探勘(DataMining)中的一個領域,他將全球資訊網中相關原始資料進一步整理並運用資料探勘的方法,以得到有用的資訊。我們已運用隨機過程...
目前,已有許多學者提出探勘頻繁一維區間樣式的方法。但是,在實務上,有許多的資料是多維度的區間,如醫學療程分析中的收縮壓、舒張壓、脈博等等。因此,在本篇論文中,我們提出一個名為「MIAMI」的演算法,以...
[[abstract]]本研究針對大型交易資料庫的關聯規則探勘,發展了一套有效率的分散式探勘系統-EDAMS (An efficient distributed association rules m...
卒業論文text近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング...