赵克佳
- 作品数:45 被引量:65H指数:4
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家高技术研究发展计划国防科技技术预先研究基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- OpenMP Fortran程序中的未指定行为的静态检测
- 未指定行为是导致OpenMP程序运行时错误的主要原因之一.本文给出一个静态地检测OpenMPFortran程序中的未指定行为的工具C-Checker.该工具基于扩展的控制流图和调用图,采用'程序分层、逐层分析'的策略分析...
- 王昭飞黄春赵克佳
- 关键词:OPENMP程序
- 一种基于负载平衡的CPU和GPU两级动态任务划分方法
- 本发明公开了一种基于负载平衡的CPU和GPU两级动态任务划分方法,要解决的技术问题在于:实现CPU和GPU之间、CPU多核之间的任务负载平衡。技术方案是为CPU和GPU之间以及CPU多核之间的任务划分建立两个数据库,记录...
- 廖湘科王锋杨灿群陈娟杜云飞易会战黄春赵克佳
- 一种并行存储系统检查点功耗优化方法
- 本发明公布了一种并行存储系统检查点功耗优化方法,要解决的技术问题是如何基于检查点操作特性对并行存储系统实施功耗优化。技术方案是为每个对象存储服务器构造一个表示该对象存储服务器的工作状态的服务器工作状态集合,该集合中的每个...
- 陈娟杨灿群黄春董勇易会战王锋杜云飞赵克佳
- 跨文件编译模式与基于GCC的实现被引量:1
- 2007年
- 有很多编译优化都与编译时的视野有关,较宽的视野能给编译器提供更详细的信息,从而能得到更好的优化效果。采用跨文件编译模式使编译器的视野扩大至整个程序将是未来的方向。本文总结了实现这种模式的一般流程以及所遇到的问题和解决方法,分析了三种已提出的跨文件过程间编译模式,最后给出了一个基于GCC3.4的跨文件编译框架的实现方法。
- 郭学鹏赵克佳
- 关键词:编译器
- GCC基于IA-64谓词执行的IF转换技术研究被引量:1
- 2005年
- 编译器在提高程序运行速度和发挥处理器性能方面起着非常关键的作用,尤其在IA-64体系结构中,其性能的发挥在很大程序上依赖于相应的编译器。IF转换利用IA-64对谓词执行的支持,删除程序中的某些控制流,将控制依赖转换为数据依赖,以便于优化。文章介绍了IA-64体系结构,并详细分析了GCC中基于IA-64谓词执行的IF转换算法。
- 田祖伟赵克佳汪小飞
- 关键词:IA-64体系结构指令级并行GCC谓词执行
- 数据流分析的关键技术研究被引量:12
- 2005年
- 数据流分析在编译优化中起着非常关键的作用,尤其是想实现一个具有技术主动权的高性能优化编译器,对数据流分析方法的研究必不可少。本文介绍了数据流分析方法的基本概念和基本原理,介绍了数据流方程的一种解决方法。并结合GCC这个具体的编译器,简要分析了其中数据流分析的具体实现方法。
- 汪小飞赵克佳田祖伟
- 关键词:数据流分析GCC迭代算法
- 双精度SIMD部件芯片级验证测试激励自动生成方法
- 本发明公开了一种双精度SIMD部件芯片级验证测试激励自动生成方法,目的是提出一种自动生成双精度SIMD部件芯片级验证测试激励的方法。技术方案为:先根据所要验证的双精度数据运算类型以及数组长度scale,构造进行双精度数组...
- 李春江易会战赵克佳杨灿群黄春王锋杜云飞陈娟彭林
- 一个最优的LRU+Hint Cache替换策略
- CPU与主存在速度上的差距日益扩大,使得处于CPU与主存间的Cache所承担的责任越显重大.要使程序得到高速的执行就必须改善Cache行为,提高Cache效率.随着EPIC体系结构中Cache提示(Hint)机制的出现,...
- 田兴彦赵克佳陈火旺
- 关键词:CPU
- 基于GCC的IF转换算法的分析与改进被引量:2
- 2005年
- 分支指令是发掘指令级并行(ILP)的一个主要障碍。IF转换能够有效地删除指令流中的分支,通过删除程序中的某些分支,将控制依赖转换为数据依赖,能够获得更好的调度效果。本文详细分析了GCC中基于IA-64谓词执行的IF转换算法,并改进了其算法,实验数据表明,优化效果明显。
- 田祖伟赵克佳
- 关键词:GCC指令级并行IA-64删除程序谓词执行指令流
- 面向双精度SIMD部件的矩阵乘实现方法
- 本发明公开了一种面向双精度SIMD部件的矩阵乘实现方法,目的是提高矩阵乘在SIMD部件上的计算速度。技术方案是先增加矩阵B和矩阵C的列数;然后对矩阵A、B进行分块;A的每个分块和对应的B分块使用SIMD部件进行相乘,并将...
- 杜云飞李春江杨灿群黄春赵克佳易会战陈娟彭林左克