按序处理器凭借其在低成本、低功耗和高可扩展能力等方面的优势,越来越多地应用于多核处理器中.为进一步满足单线程程序的性能需求,有效提升按序处理器的访存性能至关重要.本文面向典型的单发射按序处理器提出一种高能效的预执行机制,充分利用预执行过程中的有效访存结果与计算结果加速程序的执行.为达到高能效的目标,一方面,本文提出基于收益预测的预执行动态调整策略,该策略采用三种收益预测方法来识别并避免无收益的预执行阶段.另一方面,本文采用基于信心估计的转移预测机制对预执行期间无法及时判定的转移指令进行优化.实验结果表明,在平均情况下,本文方法将基础处理器的性能提升24.14%,而能耗仅增加4.3l%.与已有的两种预执行方法相比,本文方法在获取可比的性能优化效果的同时,能耗开销分别降低7.72%和10.72%,从而使能效性分别提高10.3%和11.39%.国家863高技术研究发展计划中文核心期刊要目总览(PKU)中国科技核心期刊(ISTIC)中国科学引文数据库(CSCD)02458-4633
平成19~20年度科学研究費補助金(若手研究(B))研究成果報告書近年、ノート・パソコンや携帯電話等の携帯端末においても高性能プロセッサが搭載されつつある。例えば携帯電話の内蔵カメラで撮影した動画を送...
分散スーパーコンピューテイング環境(DSE)は,分散システム上に分散共有メモリモデルに基づく並列処理機能を実現するハイパフォーマンスコンピューティング環境である.DSEでは移植性を考慮して,既存OS(...
本发明为一种并行批加工设备优化调度方法,针对批调度问题的特点,建立了基于工件组批的概率模型,设计了相应的个体采样以及概率更新方法,并对紧致遗传算法种群产生和概率更新机制进行了改进,进而提出了一种新的解...
面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随Cache容量和访存延时的变化趋势进行了量化分析.实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访...
为提高按序处理器的性能和能效性,本文提出一种基于值预测和指令复用的预执行机制(PVPIR).与传统预执行方法相比,PVPIR在预执行过程中能够预测失效Load指令的读数据并使用预测值执行与该Load指...
路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(C...
第5回先進的計算基盤システムシンポジウム SACSIS 2007 : 2007年5月23日(水)~25日(金): 東京半導体技術の微細化が進展するにつれて、従来行われて来た最悪ケースを想定したLSI設...
近年,コンピュータの頭脳であるマイクロプロセッサの信頼性低下が極めて深刻な問題として注目されている.微細加工技術の進歩に伴い劇的な性能向上を達成してきた反面,耐故障性の低下により外部/内部雑音などの影...
本稿では,マイクロプロセッサベース組込みシステムのソフトウェアレベル消費エネルギー削減手法を提 案する.提案手法はオペランドのデータをシフトし符号拡張ビット部の信号遷移を削減することにより消費エネル ...
第168回 計算機アーキテクチャ・第7回 組込みシステム 合同研究発表会 : 2008年1月15日(火)~2008年1月16日(水) : 神奈川チップマルチプロセッサでは並列処理によって性能向上を実現...
製造上の欠陥を含むチップであっても、欠陥箇所がチップの機能に影響を与えないように無効化することにより良品チップとして使用することができる。鍵となるアイデアは、いくつかの部分回路が独立して機能するように...
本发明为一种并行批加工设备优化调度方法,针对批调度问题的特点,建立了基于工件组批的概率模型,设计了相应的个体采样以及概率更新方法,并对紧致遗传算法种群产生和概率更新机制进行了改进,进而提出了一种新的解...
DAシンポジウム2008-システムLSI設計技術とDA- : 2008年8月26日(火)-27日(水) : 静岡一般的にオンチップメモリはノイズマージンの確保及び、静的消費エネルギーの削減を達成のため...
計畫編號:NSC84-2213-E032-003研究期間:199408~199507研究經費:354,000[[abstract]]為因應各方所需,計算機之計算能力與日俱 增.目前超級計算機(Supe...
У статті розглядається спосіб оптимізації енергоспоживання для одного з перспективних класів спецпро...
平成19~20年度科学研究費補助金(若手研究(B))研究成果報告書近年、ノート・パソコンや携帯電話等の携帯端末においても高性能プロセッサが搭載されつつある。例えば携帯電話の内蔵カメラで撮影した動画を送...
分散スーパーコンピューテイング環境(DSE)は,分散システム上に分散共有メモリモデルに基づく並列処理機能を実現するハイパフォーマンスコンピューティング環境である.DSEでは移植性を考慮して,既存OS(...
本发明为一种并行批加工设备优化调度方法,针对批调度问题的特点,建立了基于工件组批的概率模型,设计了相应的个体采样以及概率更新方法,并对紧致遗传算法种群产生和概率更新机制进行了改进,进而提出了一种新的解...
面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随Cache容量和访存延时的变化趋势进行了量化分析.实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访...
为提高按序处理器的性能和能效性,本文提出一种基于值预测和指令复用的预执行机制(PVPIR).与传统预执行方法相比,PVPIR在预执行过程中能够预测失效Load指令的读数据并使用预测值执行与该Load指...
路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(C...
第5回先進的計算基盤システムシンポジウム SACSIS 2007 : 2007年5月23日(水)~25日(金): 東京半導体技術の微細化が進展するにつれて、従来行われて来た最悪ケースを想定したLSI設...
近年,コンピュータの頭脳であるマイクロプロセッサの信頼性低下が極めて深刻な問題として注目されている.微細加工技術の進歩に伴い劇的な性能向上を達成してきた反面,耐故障性の低下により外部/内部雑音などの影...
本稿では,マイクロプロセッサベース組込みシステムのソフトウェアレベル消費エネルギー削減手法を提 案する.提案手法はオペランドのデータをシフトし符号拡張ビット部の信号遷移を削減することにより消費エネル ...
第168回 計算機アーキテクチャ・第7回 組込みシステム 合同研究発表会 : 2008年1月15日(火)~2008年1月16日(水) : 神奈川チップマルチプロセッサでは並列処理によって性能向上を実現...
製造上の欠陥を含むチップであっても、欠陥箇所がチップの機能に影響を与えないように無効化することにより良品チップとして使用することができる。鍵となるアイデアは、いくつかの部分回路が独立して機能するように...
本发明为一种并行批加工设备优化调度方法,针对批调度问题的特点,建立了基于工件组批的概率模型,设计了相应的个体采样以及概率更新方法,并对紧致遗传算法种群产生和概率更新机制进行了改进,进而提出了一种新的解...
DAシンポジウム2008-システムLSI設計技術とDA- : 2008年8月26日(火)-27日(水) : 静岡一般的にオンチップメモリはノイズマージンの確保及び、静的消費エネルギーの削減を達成のため...
計畫編號:NSC84-2213-E032-003研究期間:199408~199507研究經費:354,000[[abstract]]為因應各方所需,計算機之計算能力與日俱 增.目前超級計算機(Supe...
У статті розглядається спосіб оптимізації енергоспоживання для одного з перспективних класів спецпро...
平成19~20年度科学研究費補助金(若手研究(B))研究成果報告書近年、ノート・パソコンや携帯電話等の携帯端末においても高性能プロセッサが搭載されつつある。例えば携帯電話の内蔵カメラで撮影した動画を送...
分散スーパーコンピューテイング環境(DSE)は,分散システム上に分散共有メモリモデルに基づく並列処理機能を実現するハイパフォーマンスコンピューティング環境である.DSEでは移植性を考慮して,既存OS(...
本发明为一种并行批加工设备优化调度方法,针对批调度问题的特点,建立了基于工件组批的概率模型,设计了相应的个体采样以及概率更新方法,并对紧致遗传算法种群产生和概率更新机制进行了改进,进而提出了一种新的解...