国家高技术研究发展计划(2008AA01A201) 作品数:33 被引量:62 H指数:5 相关作者: 刘宏伟 吴智博 窦勇 杨孝宗 董剑 更多>> 相关机构: 哈尔滨工业大学 国防科学技术大学 沈阳军区总医院 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国际科技合作与交流专项项目 更多>> 相关领域: 自动化与计算机技术 自然科学总论 文化科学 理学 更多>>
基于FPGA的高精度科学计算加速器研究 被引量:10 2012年 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗. 雷元武 窦勇 郭松关键词:LU分解 FPGA 硬件加速器 考虑组件复制的SA软件部署可靠性研究 2012年 复制软件组件能提高服务的可靠性和系统可靠性,然而,复制额外的软件组件需要消耗系统可用系统资源.为了充分利用系统可用资源,得到更高的可靠性优化值,设计了启发式的贪婪复制算法,该算法根据单位带宽的可靠性优化值增量OB和单位内存的可靠性优化值增量OM,利用贪婪思想选择出将被复制的两个软件组件集合,其中具有更高可靠性优化值的集合是该算法确定的将被复制的软件组件集合.实验结果表明:当给定有限的系统可用资源时,与贪婪复制算法相比,该算法能得到更高的可靠性优化值和更高的服务可靠性. 苏喜红 刘宏伟 吴智博 杨孝宗 左德承关键词:可靠性 软件体系结构 基于芯片多线程处理器的性能测试及分析 被引量:1 2010年 芯片多线程处理器给现代商业负载带来了高吞吐率和并行化高性能,同时也给操作系统和软件的设计以及性能优化带来难题。为此,设计一种完全可定制的集成负载多线程测试方法,在多种负载配置下对芯片多线程处理器进行性能测试,分析不同调度方式对性能的影响,为操作系统多线程调度提出优化思想。 唐夷简 廖湘科 邵立松关键词:亲和性 对等网络中基于失效规律的自适应失效检测器研究 失效检测是维护对等网络高效运行的基础组件之一,所能提供的服务质量(准确性和检测速度)及其产生的检测负载对P2P系统的可用性和运行效率都有着极大的影响。如何在保障准确性的前提下,以较低的负载快速发现失效节点是失效检测器的设... 任潇 董剑 刘宏伟 李洋 杨孝宗关键词:对等网络 服务质量 面向容错计算机的仲裁系统的设计与实现 被引量:1 2011年 为了解决传统仲裁机制故障覆盖率和故障诊断成功率低的问题,针对容错计算机,提出了一种基于仲裁处理器的仲裁机制,并设计了仲裁系统和仲裁算法。其中仲裁处理器使用三模冗余系统和芯片级的容错设计技术,仲裁算法采用分级方式,同时采用自检测和心跳监测相结合的故障监测机制,有效地解决了单点故障和检测成功率低的问题。最后通过故障注入方式验证了仲裁系统的可用性。 韩建亚 吴智博 董剑 张亚勇 刘宏伟关键词:容错 仲裁 三模冗余 PCI总线故障注入器的研究与设计 被引量:7 2012年 为了评测计算机系统及其外设的可靠性,研究了PCI总线的拓扑结构和电气规范,分析了传统硬件嵌入式故障注入方法在PCI总线上的局限性,提出了一种新的基于PCI-to-PCI桥接IP(intellectual property,知识产权)核和FPGA技术的嵌入式故障注入方案,解决了PCI总线故障注入中的时延难题,可以向总线上的主设备和从设备注入多种类型的故障。设计了故障注入器的硬件结构和FPGA逻辑,分析了开发PCI故障注入器时需要注意的问题。针对一个典型的PCI外设进行了故障注入实验,结果表明,该方案是可行的,其功能满足设计要求。 唐志敏 董剑 吴智博 杨孝宗关键词:知识产权核 现场可编程门阵列 基于CPU-GPU混合计算平台的RNA二级结构预测算法并行化研究 被引量:5 2013年 RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU+GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优化方法,提高了混合加速系统的计算性能。实验结果表明,CPU处理单元在混合系统中承担了14%以上的计算任务,与传统的多核CPU并行方案相比,采用混合并行加速方法可获得15.93的全局加速比;与最优的单纯GPU加速方案相比,可获得16%的性能提升,并且该混合计算方案可用于对其它生物信息学序列分析应用的并行和加速。 夏飞 朱强华 金国庆关键词:生物信息学 RNA二级结构预测 Component-based software reliability analysis incorporating imperfect debugging and change-point 2014年 Against the deficiencies of component-based software(CBS) reliability modeling and analysis,for instance,importing too many assumptions,paying less attention to debugging process without considering imperfect debugging and change-point(CP) problems adequately,an approach of CBS reliability process analysis is proposed which incorporates the imperfect debugging and CP.First,perfect/imperfect debugging and CP are reviewed.Based on the queuing theory,a multi-queue multichannel and infinite server queuing model(MMISQM) is presented to sketch the integration test process of CBS.Meanwhile,considering the effects of imperfect debugging and CP,expressions for fault detection and correction are derived based on MMISQM.Numerical results demonstrate that the proposed model can sketch the integration test process of CBS with preferable performance which outperforms other models. 张策 Cui Gang Liu Hongwei Meng Fanchao Bian Yali可靠性代价和Makespan驱动的分布式容错调度算法 2012年 为解决异构分布式环境下采用主副版本策略的可靠性调度问题,提出一种基于优先级约束的可靠性代价和Makespan(调度时长)驱动的分布式容错调度算法DRCAMD。该算法可在满足系统可调度性的前提下,以异构分布式环境的节点、通信链路的可靠性与Makespan做为可调节局部目标函数,实现具有较高可靠性及较短执行时间的容错调度策略,避免将任务分配到失效率较高的节点上执行。另外,算法的副版本采用被动和主副重叠方式执行,使得容错调度算法具有较大的灵活性。仿真实验表明,该算法性能优于现有容错算法。 景维鹏 吴智博 刘宏伟 董剑一种仿生的面向可重构多细胞阵列的分布式定序方法 2011年 提出一种仿生的面向多细胞阵列的分布式定序方法.该方法是基于生物学上的图式形成理论,通过催化剂-抑制剂模型在多细胞阵列中建立浓度梯度,并在此基础上进行定序.该方法具有如下的特点:跟现有的多细胞阵列维序方法相比,它采用主动的维序方式;跟传统的分布式定序方法相比,它不需要初始特征值就能实现定序和维序.故障注入实验表明,该定序方法较现有的方法具有更强的鲁棒性,在细胞出错的情况下能够重新建立浓度梯度和重新定序.此外,我们在Xilinx公司的型号为Virtex-6 XC6VLX760的FPGA芯片上实现了5x5多细胞阵列,对浓度梯度建立和重建时间及硬件资源开销进行了评估. 吕启 徐佳庆 窦勇 冯雪关键词:仿生