In-memory技術將經常被存取的資料放置在較快、較昂貴的儲存裝置中,在資料處理時提供更佳的效能。而資料預取目標在於透過將資料從不同種類的儲存裝置中移動,以達到效能與成本的要求。然而,現存的技術並未考慮以下兩個狀況。首先,對於並不會對相同資料進行多次存取的應用程式,要如何進行最佳化。接下來是在不影響正在運行的應用程式的狀況下,釋放記憶體資源。在這篇論文中,我們提出了基於 Spark 框架的排程感知資料預取機制(Scheduling-Aware Data Prefetching based on Spark Framework,SADP),包含了資料預取與資源回收機制。SADP 將即將使用到的資料預取至記憶體中,也將記憶體中的資源釋放以供其他資料使用。最後,在真實測試平台上的實驗數據也驗證了 SADP 的可行性。In-memory techniques keep the data frequently used into faster and more expensive storage media for improving performance of data processing. Data prefetching aims to move data between difference storage media to meet requirements of performance and cost. However, exiting methods do not consider the following two problems. The first is how to benefit the data processing applications tha...
This report covers process of applying distributed computing framework Apache Spark and its softwa...
近年來社群網路服務的快速興起,大部分民眾已經習慣於使用這些社群網路服務來與親朋好友互動,社群網路服務提供者也相對應的使用越來越多的機器以及資源來保證能滿足大量使用者服務需求,但這些社群服務的使用量並不...
[[abstract]] 隨著網路使用者的日漸增加,網路資訊的大量充斥,用戶端對於網頁資訊的取得也要求更快速、更有效率,但礙於現實網路環境頻寬有限及無線資訊產品能源限制,因此在整個無線網路的環境中,...
In-memory技術將經常被存取的資料放置在較快、較昂貴的儲存裝置中,在資料處理時提供更佳的效能。而資料預取目標在於透過將資料從不同種類的儲存裝置中移動,以達到效能與成本的要求。然而,現存的技術並未...
複数コアを1チップに搭載するチップマルチプロセッサ(CMP)が注目されている。CMP は、複数コアで並列処理することで高い演算性能を達成することができる。しかしながら、メモリバンド幅の制約や複数コア搭...
实际制造企业通常通过设置公共缓冲区的方法,以此缓解柔性流水车间有限缓冲区容量限制带来的生产堵塞问题,由于公共缓冲区的存在会提高柔性流水车间排产的复杂度,因此提出一种基于模拟退火的类电磁算法(Elect...
資料的快速增長與變化以及分析工具日新月異,增加資料分析的挑戰,本研究希望透過一個完整機器學習流程,提供學術或企業在導入大數據分析時的參考藍圖。我們以Spark作為大數據分析的計算框架,利用MLlib的...
Apache Spark的記憶體管理機制,有別於Apache Flink採取積極的管理機制,主要由JVM所託管,因此也面臨因垃圾回收造成計算延遲的效能問題。Apache Spark在叢集計算過程中,垃...
本篇論文研究在頻寬受限之主從式系統中,如何利用有效的排程方法,使工作的完成時間能最小化。我們假設系統中的工作是互相獨立的。每個工作在開始執行前必須累積足夠的頻寬使用權以下載所需的輸入資料。此外我們假設...
幾乎所有的叢集與格網系統都仰賴資料以計算結果,並且在資料可被取得之前計算工作是無法開始的。因此恰當的安排資料傳輸以及工作執行對於整體的效率可以產生顯著的影響。在本篇論文中我們分別就考慮儲存空間限制與否...
[[abstract]] 隨著網際網路的高度發展及電腦設備如行動電話、PDA及筆記型電腦的普及化,在在顯示出行動通信是現代人們日常生活當中最常取得資訊的方式之一,無線網路目前已成為網路族群的新寵,在...
近年のマイクロプロセッサには処理性能を維持しつつ消費電力を削減することが求められている. 本稿では,その削減のためマイクロプロセッサとメインメモリの間に存在する動作速度の隔たりを利用する.ク リティカ...
在互联网以及电子商务飞速发展的时代,加快发展现代物流行业逐渐成为提高经济效益的重要手段。如何优化运输过程、最大可能的利用车辆装载空间,对降低运输成本、提高运输效率有着至关重要的作用。因此,车辆路径问题...
快閃記憶體的市場趨向顯示有越來越多的雲端儲存系統採用快閃記憶體當作儲存裝置,基於快閃記憶體的雲端儲存系統面臨必須滿足服務品質的挑戰,例如提供可預測的回應時間。然而,由於快閃記憶體的特性,當快閃記憶體儲...
随着云计算的快速发展,学术界、工业界能够方便地获取较为低廉的计算、存储、网络等服务。然而,为云计算服务提供支撑的数据中心的正常运行需要消耗巨大的能耗值,随之带来的对能源与环境的影响便引起越来越多的关注...
This report covers process of applying distributed computing framework Apache Spark and its softwa...
近年來社群網路服務的快速興起,大部分民眾已經習慣於使用這些社群網路服務來與親朋好友互動,社群網路服務提供者也相對應的使用越來越多的機器以及資源來保證能滿足大量使用者服務需求,但這些社群服務的使用量並不...
[[abstract]] 隨著網路使用者的日漸增加,網路資訊的大量充斥,用戶端對於網頁資訊的取得也要求更快速、更有效率,但礙於現實網路環境頻寬有限及無線資訊產品能源限制,因此在整個無線網路的環境中,...
In-memory技術將經常被存取的資料放置在較快、較昂貴的儲存裝置中,在資料處理時提供更佳的效能。而資料預取目標在於透過將資料從不同種類的儲存裝置中移動,以達到效能與成本的要求。然而,現存的技術並未...
複数コアを1チップに搭載するチップマルチプロセッサ(CMP)が注目されている。CMP は、複数コアで並列処理することで高い演算性能を達成することができる。しかしながら、メモリバンド幅の制約や複数コア搭...
实际制造企业通常通过设置公共缓冲区的方法,以此缓解柔性流水车间有限缓冲区容量限制带来的生产堵塞问题,由于公共缓冲区的存在会提高柔性流水车间排产的复杂度,因此提出一种基于模拟退火的类电磁算法(Elect...
資料的快速增長與變化以及分析工具日新月異,增加資料分析的挑戰,本研究希望透過一個完整機器學習流程,提供學術或企業在導入大數據分析時的參考藍圖。我們以Spark作為大數據分析的計算框架,利用MLlib的...
Apache Spark的記憶體管理機制,有別於Apache Flink採取積極的管理機制,主要由JVM所託管,因此也面臨因垃圾回收造成計算延遲的效能問題。Apache Spark在叢集計算過程中,垃...
本篇論文研究在頻寬受限之主從式系統中,如何利用有效的排程方法,使工作的完成時間能最小化。我們假設系統中的工作是互相獨立的。每個工作在開始執行前必須累積足夠的頻寬使用權以下載所需的輸入資料。此外我們假設...
幾乎所有的叢集與格網系統都仰賴資料以計算結果,並且在資料可被取得之前計算工作是無法開始的。因此恰當的安排資料傳輸以及工作執行對於整體的效率可以產生顯著的影響。在本篇論文中我們分別就考慮儲存空間限制與否...
[[abstract]] 隨著網際網路的高度發展及電腦設備如行動電話、PDA及筆記型電腦的普及化,在在顯示出行動通信是現代人們日常生活當中最常取得資訊的方式之一,無線網路目前已成為網路族群的新寵,在...
近年のマイクロプロセッサには処理性能を維持しつつ消費電力を削減することが求められている. 本稿では,その削減のためマイクロプロセッサとメインメモリの間に存在する動作速度の隔たりを利用する.ク リティカ...
在互联网以及电子商务飞速发展的时代,加快发展现代物流行业逐渐成为提高经济效益的重要手段。如何优化运输过程、最大可能的利用车辆装载空间,对降低运输成本、提高运输效率有着至关重要的作用。因此,车辆路径问题...
快閃記憶體的市場趨向顯示有越來越多的雲端儲存系統採用快閃記憶體當作儲存裝置,基於快閃記憶體的雲端儲存系統面臨必須滿足服務品質的挑戰,例如提供可預測的回應時間。然而,由於快閃記憶體的特性,當快閃記憶體儲...
随着云计算的快速发展,学术界、工业界能够方便地获取较为低廉的计算、存储、网络等服务。然而,为云计算服务提供支撑的数据中心的正常运行需要消耗巨大的能耗值,随之带来的对能源与环境的影响便引起越来越多的关注...
This report covers process of applying distributed computing framework Apache Spark and its softwa...
近年來社群網路服務的快速興起,大部分民眾已經習慣於使用這些社群網路服務來與親朋好友互動,社群網路服務提供者也相對應的使用越來越多的機器以及資源來保證能滿足大量使用者服務需求,但這些社群服務的使用量並不...
[[abstract]] 隨著網路使用者的日漸增加,網路資訊的大量充斥,用戶端對於網頁資訊的取得也要求更快速、更有效率,但礙於現實網路環境頻寬有限及無線資訊產品能源限制,因此在整個無線網路的環境中,...