刘颖
- 作品数:26 被引量:86H指数:3
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术航空宇航科学技术更多>>
- 面向新型应用范式与新型体系结构的编译技术
- 2024年
- 在人工智能等新兴应用对算力需求激增的背景下,编译技术作为软件和硬件之间的关键纽带,面临着前所未有的挑战和机遇。从领域编译器的发展趋势出发,着重讨论了面向新领域的编译技术;从全程序算子融合、动态形状张量编译、软硬件协同设计、计算安全等多个方面,总结并评述了面向新型应用范式与新型体系结构的具有代表性的领域编译技术;分析了领域编译技术在适应多样化计算平台、提升程序执行效率、保障软件安全以及支持芯片设计等方面的关键作用,并探讨了其应用前景及进一步的工作。
- 李广力杜臻赵家程刘颖刘颖李奕瑾张忠诚崔慧敏
- 关键词:系统软件编程框架
- 基于代码融合编译框架的OpenCL编译器设计方法和系统
- 本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统,包括:基于共享内存提供主机‑内核代码融合编译框架,在编译器的中间表示——AST层上实现不同端代码的融合;WII‑CFG图用来刻画Kernel代码被实例...
- 刘颖黄磊伍明川崔慧敏冯晓兵
- 异构数据中心中自适应编程环境技术的研究与应用
- 冯晓兵赵家程崔慧敏刘颖王蕾吕方陈莉唐生林霍玮李丰衷璐
- 随着云计算、互联网与物联网技术的快速发展,数据中心已经成为核心的计算和服务提供方。而伴随着大数据处理、高通量计算、人工智能等多样化应用在数据中心的广泛部署,传统的通用处理器难以满足来自于应用的性能、功能、延迟的多维度需求...
- 关键词:
- 关键词:数据处理方法
- 关于多核/众核系统可扩展性趋势的探讨
- 主流的多核/众核并行系统的计算能力并非与其资源成正比,其可扩展性与架构、资源部署等均有一定联系.除此之外,来自核心软件——操作系统以及并行运行时库的影响也是不可忽视的,硬件结构与核心软件将共同影响并行系统性能的充分发挥....
- 李星吕方刘颖冯晓兵
- 关键词:并行处理器多核结构可扩展性
- 一种面向便笺式存储器的带宽感知循环分块优化方法、编译系统、设备及存储介质
- 本发明提出了一种面向便笺式存储器的带宽感知循环分块优化技术,该技术通过协调考虑带宽利用率和片上存储器容量来增强传统的循环分块优化方法。根据针对DMA的测试分析得到的带宽行为模型,创建决策树以针对不同类型的数据访问模式,从...
- 伍明川刘颖崔慧敏韦清福黎权锋李立民吕方冯晓兵
- 一种数据存储方法和装置
- 本发明的实施例提供一种数据存储的方法和装置,应用于计算机领域,能够支持混合内存中待存储数据的存储。所述数据存储方法用于编译器,包括:判断待存储数据的数据类型;若所述待存储数据的数据类型是预设数据类型,获取所述待存储数据贡...
- 卢廷玉刘颖
- 一种线程间冗余删除的异构编译优化方法
- 本发明通过自动选择优化策略以及分维度进行线程间冗余删除的收益代价分析,能自动根据代码是否含有同步操作和硬件平台的特点,针对性地选择一种优化策略,通过对Kernel代码的编译分析,得出合适的合并维度和合并因子,利于提高Ke...
- 黄磊刘颖伍明川洪锐冯晓兵
- 一种数据存储方法和装置
- 本发明的实施例提供一种数据存储的方法和装置,应用于计算机领域,能够支持混合内存中待存储数据的存储。所述数据存储方法用于编译器,包括:判断待存储数据的数据类型;若所述待存储数据的数据类型是预设数据类型,获取所述待存储数据贡...
- 卢廷玉刘颖
- 面向龙芯处理器的高性能编译系统
- 龙芯编译系统是面向国产高性能通用处理器芯片——龙芯的具有高性能、高可靠性的交叉编译系统及工具链,该系统提供C、C++、Fortran等多种语言的编译支持,为龙芯平台产生高效的目标代码.龙芯编译系统与龙芯目标机结合紧密,它...
- 刘颖黄磊胡士文吕方连瑞琦
- 关键词:龙芯处理器优化技术
- 基于代码融合编译框架的OpenCL编译器设计方法和系统
- 本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统,包括:基于共享内存提供主机‑内核代码融合编译框架,在编译器的中间表示——AST层上实现不同端代码的融合;WII‑CFG图用来刻画Kernel代码被实例...
- 刘颖黄磊伍明川崔慧敏冯晓兵