为提高按序处理器的性能和能效性,本文提出一种基于值预测和指令复用的预执行机制(PVPIR).与传统预执行方法相比,PVPIR在预执行过程中能够预测失效Load指令的读数据并使用预测值执行与该Load指令数据相关的后续指令,从而对其中的长延时缓存失效提前发起存储访问以提高处理器性能,在退出预执行后,PVPIR通过复用有效的预执行结果来避免重复执行已正确完成的指令,以降低预执行的能耗开销.PVPIR实现了一种结合跨距( Stride)预测和AVD(Address-Value Delta)预测的值预测器,只记录发生过长延时缓存失效的Load指令信息,从而以较小的硬件开销取得较好的值预测效果.实验结果表明,与Runahead-AVD和iEA方法相比,PVPIR将性能分别提升7.5%和9.2%,能耗分别降低11.3%和4.9%,从而使能效性分别提高17.5%和12.9%.国家863高技术研究发展计划; 中国博士后科学基金中文核心期刊要目总览(PKU)中国科技核心期刊(ISTIC)中国科学引文数据库(CSCD)0122880-28833
[[abstract]]製造執行系統,用來綜理並執行生產系統內之製造行為。對於此種具整合與協調性質的系統軟體 而言,當其內在組成或外在條件的相對變化,從而變更其系統內模組之功能後,將產生如何進行其性 ...
[[abstract]]本連桿機構模擬系統之前、後處理,主要在研究所建構的資料庫可有效地整合圖形 資料與非圖形資料,並運用參數化的觀念設計連桿機構,達成親和性高且具有桿件 圖形預視功能的資料建構系統;...
複数コアを1チップに搭載するチップマルチプロセッサ(CMP)が注目されている。CMP は、複数コアで並列処理することで高い演算性能を達成することができる。しかしながら、メモリバンド幅の制約や複数コア搭...
按序处理器凭借其在低成本、低功耗和高可扩展能力等方面的优势,越来越多地应用于多核处理器中.为进一步满足单线程程序的性能需求,有效提升按序处理器的访存性能至关重要.本文面向典型的单发射按序处理器提出一种...
面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随Cache容量和访存延时的变化趋势进行了量化分析.实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访...
To improve the performance and energy-efficiency of in-order processors, this paper proposes a novel...
製造上の欠陥を含むチップであっても、欠陥箇所がチップの機能に影響を与えないように無効化することにより良品チップとして使用することができる。鍵となるアイデアは、いくつかの部分回路が独立して機能するように...
並列プログラムでは、計算機やネットワーク構成の選び方によって、実行性能は大きく変化する。つまり、最高の実行性能を得るためには、最適な計算機構成を選択することが重要となる。そのための手法として、並列プロ...
半導体プロセスが微細化するにつれて, ばらつきの問題が深刻化してきている. 今後の半導体産業の発展には, ばらつきを吸収する回路技術が不可欠である. プロセッサを対象とするばらつき対策の1つに, タイ...
本文针对块匹配运动估计快速搜索算法的要求,设计了一种算法可编程的运动估计及运动补偿协处理器.该协处理器设计采用软硬件协同处理结构.灵活的指令集和高效的硬件并行执行单元相结合,使得该协处理器具备可编程处...
コンピュータ・システムの高い信頼性を保つためには,障害の原因となる故障を検出する必要がある. 故障を検出する一般的な手法として,時間的または空間的冗長性の利用が挙げられる.しかし,それらの冗長性の 実...
[[abstract]]H 264/AVC編碼器比起過去的編碼標準,相對可提供更好的視覺品質。尤其H 264 High Profile是更進一步的開發應用,如專業電影製作、數位影像放映和高解析度的電視...
Although currently available general purpose microprocessors feature more than 10 cores, many progra...
情報処理学会九州支部若手の会セミナー 日時:2007年9月3,4日 会場:国民宿舎 波戸岬(唐津市)近年,LSI の微細化が進み製造ばらつきが深刻になっている.特にチップ内で発生するトランジスタ 特性...
本发明公开一种批准备连续单处理的预测控制调度方法,属于生产计划与调度领域。批准备连续单处理是指生产任务只有达到一定批量后才能开动机器进行加工,但是加工时,并不是所有的生产任务一次性进行加工,而是生产任...
[[abstract]]製造執行系統,用來綜理並執行生產系統內之製造行為。對於此種具整合與協調性質的系統軟體 而言,當其內在組成或外在條件的相對變化,從而變更其系統內模組之功能後,將產生如何進行其性 ...
[[abstract]]本連桿機構模擬系統之前、後處理,主要在研究所建構的資料庫可有效地整合圖形 資料與非圖形資料,並運用參數化的觀念設計連桿機構,達成親和性高且具有桿件 圖形預視功能的資料建構系統;...
複数コアを1チップに搭載するチップマルチプロセッサ(CMP)が注目されている。CMP は、複数コアで並列処理することで高い演算性能を達成することができる。しかしながら、メモリバンド幅の制約や複数コア搭...
按序处理器凭借其在低成本、低功耗和高可扩展能力等方面的优势,越来越多地应用于多核处理器中.为进一步满足单线程程序的性能需求,有效提升按序处理器的访存性能至关重要.本文面向典型的单发射按序处理器提出一种...
面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随Cache容量和访存延时的变化趋势进行了量化分析.实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访...
To improve the performance and energy-efficiency of in-order processors, this paper proposes a novel...
製造上の欠陥を含むチップであっても、欠陥箇所がチップの機能に影響を与えないように無効化することにより良品チップとして使用することができる。鍵となるアイデアは、いくつかの部分回路が独立して機能するように...
並列プログラムでは、計算機やネットワーク構成の選び方によって、実行性能は大きく変化する。つまり、最高の実行性能を得るためには、最適な計算機構成を選択することが重要となる。そのための手法として、並列プロ...
半導体プロセスが微細化するにつれて, ばらつきの問題が深刻化してきている. 今後の半導体産業の発展には, ばらつきを吸収する回路技術が不可欠である. プロセッサを対象とするばらつき対策の1つに, タイ...
本文针对块匹配运动估计快速搜索算法的要求,设计了一种算法可编程的运动估计及运动补偿协处理器.该协处理器设计采用软硬件协同处理结构.灵活的指令集和高效的硬件并行执行单元相结合,使得该协处理器具备可编程处...
コンピュータ・システムの高い信頼性を保つためには,障害の原因となる故障を検出する必要がある. 故障を検出する一般的な手法として,時間的または空間的冗長性の利用が挙げられる.しかし,それらの冗長性の 実...
[[abstract]]H 264/AVC編碼器比起過去的編碼標準,相對可提供更好的視覺品質。尤其H 264 High Profile是更進一步的開發應用,如專業電影製作、數位影像放映和高解析度的電視...
Although currently available general purpose microprocessors feature more than 10 cores, many progra...
情報処理学会九州支部若手の会セミナー 日時:2007年9月3,4日 会場:国民宿舎 波戸岬(唐津市)近年,LSI の微細化が進み製造ばらつきが深刻になっている.特にチップ内で発生するトランジスタ 特性...
本发明公开一种批准备连续单处理的预测控制调度方法,属于生产计划与调度领域。批准备连续单处理是指生产任务只有达到一定批量后才能开动机器进行加工,但是加工时,并不是所有的生产任务一次性进行加工,而是生产任...
[[abstract]]製造執行系統,用來綜理並執行生產系統內之製造行為。對於此種具整合與協調性質的系統軟體 而言,當其內在組成或外在條件的相對變化,從而變更其系統內模組之功能後,將產生如何進行其性 ...
[[abstract]]本連桿機構模擬系統之前、後處理,主要在研究所建構的資料庫可有效地整合圖形 資料與非圖形資料,並運用參數化的觀念設計連桿機構,達成親和性高且具有桿件 圖形預視功能的資料建構系統;...
複数コアを1チップに搭載するチップマルチプロセッサ(CMP)が注目されている。CMP は、複数コアで並列処理することで高い演算性能を達成することができる。しかしながら、メモリバンド幅の制約や複数コア搭...