在循序樣式的資料庫中,一個交易 (transaction)只包括一個序列(sequence) 且每一個序列皆互為獨立的,彼此不相 關。我們稱此類的資料探勘為序列中的 關聯法則(intra-sequence association rules)。我們進一步探討序列間樣式的關 聯,我們稱之為序列間的關聯法則 (inter-sequence association rules)。就我們 所知,目前,並沒有任何的資料探勘的 技術,特別設計來找尋序列間的關聯法 則。而序列間的關聯法則可應用於分析 許多應用層面的資料:如,WWW 的路 徑追蹤樣式、通信資料、疾病症狀、氣 候、股票波動與DNA 序列等等。 因此,在本計劃中,我們提出一個 找尋序列間的關聯法則的演算法。首 先,我們使用PrefixSpan 的演算法找尋 所有的循序樣式,然後使用level-wise 的演算法檢查序列集合是否為大序列集 合(large sequence-set)。同時,我們將每 一個循序樣式發生的時間紀錄在一個時 間串列中(time point list),然後,我們將 這些時間串列分成好幾個群組,並將它 們儲存於L-buckets 中。因為我們使用時 間串列及L-buckets 加速支持度的計算 (support counting),使得我們所提出的演 算法比Apriori-like 演算法更有效率。There are many algorithms proposed to find sequential patterns in sequence databases where a transaction contains a sequence. Previously proposed algorithms ...
近年來,時間序列資料庫以蓬勃的速度廣泛地被應用在各領域中,如:財務資料分析、網路流量分析或移動物件追蹤等等。因為一條線段可包含許多的點,以點表示的樣式長度會比以線段表示的樣式長度要大許多。因此,探勘線...
跨交易關聯規則可代表不同交易中項目間的關係,而近年來有愈來愈多相關的探勘演算法被提出,然而這些演算法會產生相當多的跨交易頻繁項目集合。找尋封閉性跨交易頻繁項目集合可使探勘的過程更有效率。 因此,在本篇...
隨著多媒體影像技術的蓬勃發展,多媒體資料量快速地遽增,如何從龐大的多媒體資料中找到有意義的資訊和特性已成為熱門的研究議題。我們可以將影片中發生的一個事件視為一個連續的點集合,而找到影片資料庫中由點集合...
[[abstract]] 資料串流探勘是一個新興的研究領域,而關聯規則演算法是資料探勘 (Data Mining)中一項相當重要且實用的技術。關聯式法則最主要的目的就是在龐大的資料中,把一些資料項目...
碩士資訊工程學系[[abstract]]分群法(clustering)及關聯性法則探勘(association rules mining)是資料探勘領域中兩種重要的方法。分群法主要用來分析尚未整理以及...
[[abstract]]為了改善傳統的推薦系統的推薦品質,本研究將「近期」與「利潤」兩個因素納入推薦系統的設計,主要目的為偵測出顧客隨著時間變異而改變的購買樣式,進而推薦有較高利潤與顧客目前可能感興趣...
序列樣式分析已經被廣泛地應用在許多領域上,且已經有許多尋找序列樣式的方法被提出。但是目前所提出的方法只考慮每筆交易只含有一條序列,並沒有考慮每筆交易含有多序列的情形,也沒有考慮到項目集合間的時間間隔,...
本論文提出三個探勘移動軌跡樣式的演算法: GBM、 FTM 及LTM。GBM 尋找由空間中連續的格點組成的樣式,而格點間的時間延遲則由時間間隔代表。FTM 探勘彈性移動軌跡樣式,其中樣式的格點不一定要...
隨著無線射頻識別技術的逐漸普及,預料市場上將會產生許多相關應用。因此,我們提出了一個在擁有無線射頻識別技術之商場內的應用。我們收集顧客購物時所走過的路徑以及最後所購買的商品,想要探勘頻繁購物路徑與頻繁...
基因表現之時間序列資料可以用來表現基因調控事件間之因果關係。然而,現有的分析方法如基因網絡模型建構僅採用單一樣本的基因表現時間序列資料來建立基因網絡,其結果之準確率仍有待提升。此外,基因網絡模型建構受...
計畫編號:NSC93-2213-E032-012研究期間:200408~200507研究經費:392,000[[abstract]]探勘序列型樣的主要任務是對商家的交易資料庫進行分析,其目的在找出大部...
[[abstract]] 過去,大部分的研究通常簡化知識發掘的過程以方便進行研究,或把挖掘過程遇到的問題分開單一討論與解決;但現實上整個程序必須整合人工處理程序及機器處理程序,而且整個知識發掘過程是...
[[abstract]]網路習慣探勘(Web Usage Mining, WUM)是一種用來分析網路使用者瀏覽網站習性的技術,在眾多WUM方法中,網路交易探勘(Web Transaction Mini...
蛋白質序列中的序列樣式,和蛋白質所執行的功能有著密不可分的關係。因此,如何從蛋白質序列資料庫中,透過系統化的方法,探勘出重要的序列樣式,已成為一個相當重要的研究課題。 針對此一課題,本論文提出了一個...
近年來,時間序列特性的資料以蓬勃的速度被廣泛地應用在各個領域中,例如財務資料分析、網路流量分析或科學數據的處理等等。從時間序列資料庫中找尋不同解析度的頻繁樣式,可以幫助科學家或是財務分析師判斷發展趨勢...
近年來,時間序列資料庫以蓬勃的速度廣泛地被應用在各領域中,如:財務資料分析、網路流量分析或移動物件追蹤等等。因為一條線段可包含許多的點,以點表示的樣式長度會比以線段表示的樣式長度要大許多。因此,探勘線...
跨交易關聯規則可代表不同交易中項目間的關係,而近年來有愈來愈多相關的探勘演算法被提出,然而這些演算法會產生相當多的跨交易頻繁項目集合。找尋封閉性跨交易頻繁項目集合可使探勘的過程更有效率。 因此,在本篇...
隨著多媒體影像技術的蓬勃發展,多媒體資料量快速地遽增,如何從龐大的多媒體資料中找到有意義的資訊和特性已成為熱門的研究議題。我們可以將影片中發生的一個事件視為一個連續的點集合,而找到影片資料庫中由點集合...
[[abstract]] 資料串流探勘是一個新興的研究領域,而關聯規則演算法是資料探勘 (Data Mining)中一項相當重要且實用的技術。關聯式法則最主要的目的就是在龐大的資料中,把一些資料項目...
碩士資訊工程學系[[abstract]]分群法(clustering)及關聯性法則探勘(association rules mining)是資料探勘領域中兩種重要的方法。分群法主要用來分析尚未整理以及...
[[abstract]]為了改善傳統的推薦系統的推薦品質,本研究將「近期」與「利潤」兩個因素納入推薦系統的設計,主要目的為偵測出顧客隨著時間變異而改變的購買樣式,進而推薦有較高利潤與顧客目前可能感興趣...
序列樣式分析已經被廣泛地應用在許多領域上,且已經有許多尋找序列樣式的方法被提出。但是目前所提出的方法只考慮每筆交易只含有一條序列,並沒有考慮每筆交易含有多序列的情形,也沒有考慮到項目集合間的時間間隔,...
本論文提出三個探勘移動軌跡樣式的演算法: GBM、 FTM 及LTM。GBM 尋找由空間中連續的格點組成的樣式,而格點間的時間延遲則由時間間隔代表。FTM 探勘彈性移動軌跡樣式,其中樣式的格點不一定要...
隨著無線射頻識別技術的逐漸普及,預料市場上將會產生許多相關應用。因此,我們提出了一個在擁有無線射頻識別技術之商場內的應用。我們收集顧客購物時所走過的路徑以及最後所購買的商品,想要探勘頻繁購物路徑與頻繁...
基因表現之時間序列資料可以用來表現基因調控事件間之因果關係。然而,現有的分析方法如基因網絡模型建構僅採用單一樣本的基因表現時間序列資料來建立基因網絡,其結果之準確率仍有待提升。此外,基因網絡模型建構受...
計畫編號:NSC93-2213-E032-012研究期間:200408~200507研究經費:392,000[[abstract]]探勘序列型樣的主要任務是對商家的交易資料庫進行分析,其目的在找出大部...
[[abstract]] 過去,大部分的研究通常簡化知識發掘的過程以方便進行研究,或把挖掘過程遇到的問題分開單一討論與解決;但現實上整個程序必須整合人工處理程序及機器處理程序,而且整個知識發掘過程是...
[[abstract]]網路習慣探勘(Web Usage Mining, WUM)是一種用來分析網路使用者瀏覽網站習性的技術,在眾多WUM方法中,網路交易探勘(Web Transaction Mini...
蛋白質序列中的序列樣式,和蛋白質所執行的功能有著密不可分的關係。因此,如何從蛋白質序列資料庫中,透過系統化的方法,探勘出重要的序列樣式,已成為一個相當重要的研究課題。 針對此一課題,本論文提出了一個...
近年來,時間序列特性的資料以蓬勃的速度被廣泛地應用在各個領域中,例如財務資料分析、網路流量分析或科學數據的處理等等。從時間序列資料庫中找尋不同解析度的頻繁樣式,可以幫助科學家或是財務分析師判斷發展趨勢...
近年來,時間序列資料庫以蓬勃的速度廣泛地被應用在各領域中,如:財務資料分析、網路流量分析或移動物件追蹤等等。因為一條線段可包含許多的點,以點表示的樣式長度會比以線段表示的樣式長度要大許多。因此,探勘線...
跨交易關聯規則可代表不同交易中項目間的關係,而近年來有愈來愈多相關的探勘演算法被提出,然而這些演算法會產生相當多的跨交易頻繁項目集合。找尋封閉性跨交易頻繁項目集合可使探勘的過程更有效率。 因此,在本篇...
隨著多媒體影像技術的蓬勃發展,多媒體資料量快速地遽增,如何從龐大的多媒體資料中找到有意義的資訊和特性已成為熱門的研究議題。我們可以將影片中發生的一個事件視為一個連續的點集合,而找到影片資料庫中由點集合...