MapReduce是一个目前应用广泛的并行计算框架,如何解决Reduce节点的负载平衡问题是MapReduce程序执行效率的一个重要研究方向。基于抽样的划分是一种比较有效的数据划分方法,为了使得抽样方法发挥最大程度的效益,研究了抽样效果与其重要影响因素之间的定量关系,并给出了相关理论及其证明推导,同时通过实验进一步验证了理论的正确性。基于研究的结果,可以在给定MapReduce环境中,通过分析数据特征,找到最优抽样样本规模,从而通过尽可能小的抽样代价来得到满足要求的数据划分。通过将研究成果应用在改进的Terasort算法上,以实例验证了其在MapRedece平台上的实际意义。
[[abstract]]本研究以Mobile Web-Based為基礎,提出一套基於無線手持式?動裝置之跨平台教室互動系統的設計與研發。經相關??與需求分析,本研究提出具五大功能模組之系統設計,並以大...
本文以河南省公路网络通达性为研究对象,首先建立1985、1994和2008年河南省公路网路ArcGIS数据库,然后采用通达性测度模型,对1985-2008年间河南省公路网络通达性的时空演变进行了分析,...
马尾松毛虫Dendrolimuspunctatus(Walker)雄蛾有一对羽毛状触角。在触角鞭节的每对侧枝的内侧(迎风面)着生许多毛状感受器。每个毛状感受器由几丁质表皮毛及位于其下的三个感觉神经原和...
本发明公布一种MapReduce系统中的任务调度方法和流水化执行方法,将有依赖关系的任务根据依赖关系和优先程度进行任务调度,使得有依赖关系的任务之间的执行重叠最大化:任务之间的依赖关系用DAG关系图表...
云计算服务模式统一管理并高效利用计算资源和数据资源,使用户能够享受可靠、可扩展和廉价的计算服务。目前,主流基于MapReduce并行框架构建的云计算环境适用于很多计算任务。但是,作为一种开放服务,在多...
MapReduce是由Google提出的并行计算框架,具备高可扩展性、高可用性和良好的容错性,现已广泛应用于处理大规模数据。连接操作是大数据分析中的一个常见运算,随着数据规模的进一步增大,如何有效处理...
基于宏观拟颗粒模型(MaPPM),提出了一种适合不同粒径复杂粒子系统和多相流体系统的并行算法.利用多重网格技术,对每个计算处理器(PE)上不同粒径级别的粒子根据其所在位置进行分区管理.应用所设计的算法...
本发明公布了一种针对GPU程序的源码级数据传输能耗估算方法,包括如下步骤:基础参数测量计算:针对具体的CPU+GPU异构体系平台单机系统,进行系列基本测量,标定程序状态相关的基本参数;其中,需要测量的...
数据库中间件是一种独立的系统软件或服务程序,在分布式的上层应用与数据库之间起着承上启下的作用。分布式数据库访问中间件(Distributed Database Access Middleware,DD...
本发明涉及一种并行计算框架中的Reduce端自适应负载均衡方法,通过采用动态哈希函数划分方法来预测任务所输入数据的分布,并且根据所预测数据的分布特点产生一个静态哈希函数,使得在该静态哈希函数的作用下,...
本发明涉及一种基于CUDA并行环境的GPU并行程序优化方法,定义了GPU程序内核的性能瓶颈,根据级别包括全局储存器访问延迟、共享存储器访问冲突、指令流水线冲突、指令瓶颈。并为每个性能瓶颈提出实际可操作...
XML已经成为网络中信息表示和交互的重要标准,基于组件的软件系统在运行前需要在平台中进行部署并配置XML文档。由于XML文档允许自定义格式,不同的服务器厂商有特定的XML部署描述文件Schema,当进...
本发明公开了一种基于推迟提交的GPU虚拟化优化方法。本方法为:1)客户机上的GPU虚拟化框架前端读入一待执行CUDA应用程序的二进制文件,查找并标记可推迟提交的循环;2)前端执行到可推迟提交的循环部分...
视网膜脱离(RD)是指视网膜神经上皮层与色素上皮层之间的分离,是临床常见的引起视功能严重损害的疾病。视网膜脱离手术后的解剖复位率达95%以上,但手术后视功能恢复仍不理想。对动物和人视网膜脱离的实验研究...
研究测定了寄生于草鱼肠道的鲩肠袋虫的18S rDNA序列。鲩肠袋虫的18S rDNA基因序列包括1638个碱基。分别用3种分析方法(邻接法、最大简约法、贝叶斯法)构建了毛口亚纲的系统发育树,得到结果如...
[[abstract]]本研究以Mobile Web-Based為基礎,提出一套基於無線手持式?動裝置之跨平台教室互動系統的設計與研發。經相關??與需求分析,本研究提出具五大功能模組之系統設計,並以大...
本文以河南省公路网络通达性为研究对象,首先建立1985、1994和2008年河南省公路网路ArcGIS数据库,然后采用通达性测度模型,对1985-2008年间河南省公路网络通达性的时空演变进行了分析,...
马尾松毛虫Dendrolimuspunctatus(Walker)雄蛾有一对羽毛状触角。在触角鞭节的每对侧枝的内侧(迎风面)着生许多毛状感受器。每个毛状感受器由几丁质表皮毛及位于其下的三个感觉神经原和...
本发明公布一种MapReduce系统中的任务调度方法和流水化执行方法,将有依赖关系的任务根据依赖关系和优先程度进行任务调度,使得有依赖关系的任务之间的执行重叠最大化:任务之间的依赖关系用DAG关系图表...
云计算服务模式统一管理并高效利用计算资源和数据资源,使用户能够享受可靠、可扩展和廉价的计算服务。目前,主流基于MapReduce并行框架构建的云计算环境适用于很多计算任务。但是,作为一种开放服务,在多...
MapReduce是由Google提出的并行计算框架,具备高可扩展性、高可用性和良好的容错性,现已广泛应用于处理大规模数据。连接操作是大数据分析中的一个常见运算,随着数据规模的进一步增大,如何有效处理...
基于宏观拟颗粒模型(MaPPM),提出了一种适合不同粒径复杂粒子系统和多相流体系统的并行算法.利用多重网格技术,对每个计算处理器(PE)上不同粒径级别的粒子根据其所在位置进行分区管理.应用所设计的算法...
本发明公布了一种针对GPU程序的源码级数据传输能耗估算方法,包括如下步骤:基础参数测量计算:针对具体的CPU+GPU异构体系平台单机系统,进行系列基本测量,标定程序状态相关的基本参数;其中,需要测量的...
数据库中间件是一种独立的系统软件或服务程序,在分布式的上层应用与数据库之间起着承上启下的作用。分布式数据库访问中间件(Distributed Database Access Middleware,DD...
本发明涉及一种并行计算框架中的Reduce端自适应负载均衡方法,通过采用动态哈希函数划分方法来预测任务所输入数据的分布,并且根据所预测数据的分布特点产生一个静态哈希函数,使得在该静态哈希函数的作用下,...
本发明涉及一种基于CUDA并行环境的GPU并行程序优化方法,定义了GPU程序内核的性能瓶颈,根据级别包括全局储存器访问延迟、共享存储器访问冲突、指令流水线冲突、指令瓶颈。并为每个性能瓶颈提出实际可操作...
XML已经成为网络中信息表示和交互的重要标准,基于组件的软件系统在运行前需要在平台中进行部署并配置XML文档。由于XML文档允许自定义格式,不同的服务器厂商有特定的XML部署描述文件Schema,当进...
本发明公开了一种基于推迟提交的GPU虚拟化优化方法。本方法为:1)客户机上的GPU虚拟化框架前端读入一待执行CUDA应用程序的二进制文件,查找并标记可推迟提交的循环;2)前端执行到可推迟提交的循环部分...
视网膜脱离(RD)是指视网膜神经上皮层与色素上皮层之间的分离,是临床常见的引起视功能严重损害的疾病。视网膜脱离手术后的解剖复位率达95%以上,但手术后视功能恢复仍不理想。对动物和人视网膜脱离的实验研究...
研究测定了寄生于草鱼肠道的鲩肠袋虫的18S rDNA序列。鲩肠袋虫的18S rDNA基因序列包括1638个碱基。分别用3种分析方法(邻接法、最大简约法、贝叶斯法)构建了毛口亚纲的系统发育树,得到结果如...
[[abstract]]本研究以Mobile Web-Based為基礎,提出一套基於無線手持式?動裝置之跨平台教室互動系統的設計與研發。經相關??與需求分析,本研究提出具五大功能模組之系統設計,並以大...
本文以河南省公路网络通达性为研究对象,首先建立1985、1994和2008年河南省公路网路ArcGIS数据库,然后采用通达性测度模型,对1985-2008年间河南省公路网络通达性的时空演变进行了分析,...
马尾松毛虫Dendrolimuspunctatus(Walker)雄蛾有一对羽毛状触角。在触角鞭节的每对侧枝的内侧(迎风面)着生许多毛状感受器。每个毛状感受器由几丁质表皮毛及位于其下的三个感觉神经原和...