頻繁項目集的探勘,也就是從大型資料庫中找出頻繁項目集。這是許多其他問題的根本和基礎,像是關連規則、循序規則、分類和許多其他的課題。 在過去十年來,這個問題已經有了很大的進展。許多的演算法或改進現有演算法都不斷的被提出。然而,當我們降低最低支持度或是當我們遇到的資料庫是高度關連的時候,頻繁項目集的數目可能會極大。因此,如何應付密集資料庫仍然是一各具挑戰性的課題。 在這篇論文裡,我們提出cdeNDI這一種新演算法。這是以Eclat這個演算法為基礎,將closed itemsets和non-derivable itemsets的觀念結合。在我們演算法一開始,就像是Eclat這個演算法額外加上deduction rules的計算。當我們發現derivable itemsets後,我們便改用deduction rules來計算這個項目集的超集合的支持度。這使的我們在長頻繁項目集的尋找上會更為快速。而為了讓deduction rules能夠在depth-first搜尋中運作,我們將搜尋的順序改為逆的,並且採用靜態遞減排序法。為了要提供快速的頻繁項目集支持度搜尋,我們使用closed trie來儲存已發現的頻繁項目集的支持度。Closed trie不但提供高效率的搜尋,而且也壓縮了儲存的空間。這麼一來,我們可以在密集、高度關連的資料中有好表現。而以現實生活和綜合性資料庫來做實驗的結果,也顯示我們在現實生活資料庫中比其他演算法有更好的效果。Frequent itemsets mining, which finds frequent itemsets from a large database, is a fundamental and essential for many proble...
Modbus TCP在工業控制系統(Industrial Control System, ICS)中是一廣泛使用且著名的工業通訊協定,然而ICSs所遭受的攻擊數量也日益增多,導致工業控制網路的防護意識...
本計劃為整合型計劃『行動電子商務 系統關鍵技術之研發與實作』之一子計劃 『行動電子商務系統中之資訊勘測與資 訊存取演算法之研發與實作』之第三年計 劃。目前新一代行動商務技術正在研發, 未來的行動商務環...
近年來,由於部落格數量以及部落客人數大幅增加,著實改變了網路上人與人之間溝通的方式。舉例來說,部落客可以將推薦的部落格加入部落格連結,而產生了部落格和部落格之間的關係;每個部落客在發表貼文時,可以引用...
在今日以客戶為導向的市場中,“給較好的客戶較好的服務”的概念已經逐漸轉變為“給每一位客戶適當的服務”。藉由跨域行銷(cross-selling)的方式,企業可以為不同的客戶提供適當的服務及商品組合。臺...
全球面臨人口老化與人口不斷成長的壓力下,對於醫療服務的需求不斷提升。醫療服務領域中常以資料探勘「關聯規則」分析,挖掘隱藏在龐大的醫學資料庫中的知識(knowledge),以支援臨床決策或創新醫療服務。...
隨著知識經濟的蓬勃,如何善用資訊產生知識儼然成為企業持續成長的關鍵利基。因此,如何有效保存與傳遞知識向來為知識管理領域的所探討的關鍵議題。依據知識的能見度可將知識分為顯性知識與隱性知識,隱性知識是經由...
近年來由於基因體定序計畫的迅速發展,提供大量的序列資訊,在此潮流下,若能從胺基酸序列資訊直接預測蛋白質-蛋白質互動鍵結區,將可幫助生物學家建立正確的調控網路或代謝路徑,有助於許多相關研究之發展。在此研...
碩士論文[[abstract]]隨著網際網路(Internet)的快速發展,藉由網路任何人都可以用最快的速度獲得資訊。然而許多使用者在點選了大量網頁之後,常常無法得到自己想要的資訊。特別是隨著網頁製作...
一個片段在序列中重複出現的現像稱之為「重覆性樣式」。這樣的重覆性樣式在許多不同的領域像是音樂分析以及生物資訊演算法上伴演著重要的角色。 在音樂分析上,重覆性樣式即為一段連續的音符在樂曲中重覆出現的現象...
[[abstract]] 隨著社會經濟的發展,民眾的生活型態有著逐漸的改善,這也使得休閒旅遊已成為民眾重視的生活議題。顧客關係管理(Customer Relationship Management,...
隨著行車交通安全越來越受到重視,行人偵測技術在電腦視覺中是一項非常重要的課題。本論文的目標在於搭建一個實時的行人偵測技術平臺,目標在於能夠使用普通個人電腦的CPU達到實時處理視頻數據,從中找出行人的效...
在大数据的时代背景下,由于网络数据(network data)能有效简洁地描述社交网络、电子商务、医疗记录、在线教育等多种应用中各类复杂关系,越来越受到工业界和学术界的关注。在社交网络分析任务中,一个...
過去對於探勘常見項目集的研究僅限於找出資料庫中交易紀錄的子集合,在這篇論文中,我們提出一個新的探勘主題:常見超集合探勘。常見超集合意指它包含資料庫中各筆紀錄的筆數多於最小門檻值,而原本用來探勘常見子集...
針對倒帳機率的預測,除了會計變數於學術界與實務界大行其道外,許多研究皆指出總體與產業因素對於倒帳機率亦具有預測能力;然而,卻鮮少有研究針對美國以外地區個別產業倒帳機率的預測因子進行探討分析。本研究目的...
隨著網際網路的廣泛應用,各類型的網路攻擊技術也相繼出現,對許多電子化的企業、機關的威脅也愈來愈大。舊有的被動防禦措施,如:防火牆、密碼保護,在攻擊技術的精進下便顯得不足。因此入侵偵測系統這個主動偵測攻...
Modbus TCP在工業控制系統(Industrial Control System, ICS)中是一廣泛使用且著名的工業通訊協定,然而ICSs所遭受的攻擊數量也日益增多,導致工業控制網路的防護意識...
本計劃為整合型計劃『行動電子商務 系統關鍵技術之研發與實作』之一子計劃 『行動電子商務系統中之資訊勘測與資 訊存取演算法之研發與實作』之第三年計 劃。目前新一代行動商務技術正在研發, 未來的行動商務環...
近年來,由於部落格數量以及部落客人數大幅增加,著實改變了網路上人與人之間溝通的方式。舉例來說,部落客可以將推薦的部落格加入部落格連結,而產生了部落格和部落格之間的關係;每個部落客在發表貼文時,可以引用...
在今日以客戶為導向的市場中,“給較好的客戶較好的服務”的概念已經逐漸轉變為“給每一位客戶適當的服務”。藉由跨域行銷(cross-selling)的方式,企業可以為不同的客戶提供適當的服務及商品組合。臺...
全球面臨人口老化與人口不斷成長的壓力下,對於醫療服務的需求不斷提升。醫療服務領域中常以資料探勘「關聯規則」分析,挖掘隱藏在龐大的醫學資料庫中的知識(knowledge),以支援臨床決策或創新醫療服務。...
隨著知識經濟的蓬勃,如何善用資訊產生知識儼然成為企業持續成長的關鍵利基。因此,如何有效保存與傳遞知識向來為知識管理領域的所探討的關鍵議題。依據知識的能見度可將知識分為顯性知識與隱性知識,隱性知識是經由...
近年來由於基因體定序計畫的迅速發展,提供大量的序列資訊,在此潮流下,若能從胺基酸序列資訊直接預測蛋白質-蛋白質互動鍵結區,將可幫助生物學家建立正確的調控網路或代謝路徑,有助於許多相關研究之發展。在此研...
碩士論文[[abstract]]隨著網際網路(Internet)的快速發展,藉由網路任何人都可以用最快的速度獲得資訊。然而許多使用者在點選了大量網頁之後,常常無法得到自己想要的資訊。特別是隨著網頁製作...
一個片段在序列中重複出現的現像稱之為「重覆性樣式」。這樣的重覆性樣式在許多不同的領域像是音樂分析以及生物資訊演算法上伴演著重要的角色。 在音樂分析上,重覆性樣式即為一段連續的音符在樂曲中重覆出現的現象...
[[abstract]] 隨著社會經濟的發展,民眾的生活型態有著逐漸的改善,這也使得休閒旅遊已成為民眾重視的生活議題。顧客關係管理(Customer Relationship Management,...
隨著行車交通安全越來越受到重視,行人偵測技術在電腦視覺中是一項非常重要的課題。本論文的目標在於搭建一個實時的行人偵測技術平臺,目標在於能夠使用普通個人電腦的CPU達到實時處理視頻數據,從中找出行人的效...
在大数据的时代背景下,由于网络数据(network data)能有效简洁地描述社交网络、电子商务、医疗记录、在线教育等多种应用中各类复杂关系,越来越受到工业界和学术界的关注。在社交网络分析任务中,一个...
過去對於探勘常見項目集的研究僅限於找出資料庫中交易紀錄的子集合,在這篇論文中,我們提出一個新的探勘主題:常見超集合探勘。常見超集合意指它包含資料庫中各筆紀錄的筆數多於最小門檻值,而原本用來探勘常見子集...
針對倒帳機率的預測,除了會計變數於學術界與實務界大行其道外,許多研究皆指出總體與產業因素對於倒帳機率亦具有預測能力;然而,卻鮮少有研究針對美國以外地區個別產業倒帳機率的預測因子進行探討分析。本研究目的...
隨著網際網路的廣泛應用,各類型的網路攻擊技術也相繼出現,對許多電子化的企業、機關的威脅也愈來愈大。舊有的被動防禦措施,如:防火牆、密碼保護,在攻擊技術的精進下便顯得不足。因此入侵偵測系統這個主動偵測攻...
Modbus TCP在工業控制系統(Industrial Control System, ICS)中是一廣泛使用且著名的工業通訊協定,然而ICSs所遭受的攻擊數量也日益增多,導致工業控制網路的防護意識...
本計劃為整合型計劃『行動電子商務 系統關鍵技術之研發與實作』之一子計劃 『行動電子商務系統中之資訊勘測與資 訊存取演算法之研發與實作』之第三年計 劃。目前新一代行動商務技術正在研發, 未來的行動商務環...
近年來,由於部落格數量以及部落客人數大幅增加,著實改變了網路上人與人之間溝通的方式。舉例來說,部落客可以將推薦的部落格加入部落格連結,而產生了部落格和部落格之間的關係;每個部落客在發表貼文時,可以引用...