您的位置: 专家智库 > >

郑启龙

作品数:100 被引量:193H指数:6
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:国家科技重大专项安徽省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学电子电信建筑科学更多>>

文献类型

  • 78篇期刊文章
  • 12篇会议论文
  • 8篇科技成果
  • 2篇学位论文

领域

  • 90篇自动化与计算...
  • 5篇文化科学
  • 4篇电子电信
  • 1篇经济管理
  • 1篇天文地球
  • 1篇建筑科学
  • 1篇水利工程

主题

  • 12篇分簇
  • 11篇计算机
  • 10篇调度
  • 9篇DSP
  • 8篇MAPRED...
  • 7篇多核
  • 7篇信号
  • 7篇信号处理
  • 7篇数字信号
  • 7篇数字信号处理
  • 6篇信号处理器
  • 6篇神经网
  • 6篇神经网络
  • 6篇数字信号处理...
  • 6篇程序设计
  • 6篇处理器
  • 6篇高性能
  • 5篇网络
  • 5篇教学
  • 5篇高性能计算机

机构

  • 90篇中国科学技术...
  • 19篇安徽省高性能...
  • 8篇中国电子科技...
  • 6篇合肥工业大学
  • 6篇渤海大学
  • 3篇国家高性能计...
  • 2篇中国刑事警察...
  • 1篇安徽大学
  • 1篇电子科技大学
  • 1篇中国科技大学
  • 1篇中北大学
  • 1篇北京北方计算...
  • 1篇安徽芯纪元科...
  • 1篇科技公司

作者

  • 100篇郑启龙
  • 20篇陈国良
  • 12篇王向前
  • 11篇许胤龙
  • 9篇黄刘生
  • 9篇王昊
  • 8篇房明
  • 8篇安虹
  • 8篇姚震
  • 7篇李春生
  • 6篇胡晨光
  • 6篇杨晓奇
  • 6篇陈华平
  • 6篇徐云
  • 6篇姚再勇
  • 6篇张红涛
  • 5篇陈思灵
  • 5篇孙广中
  • 5篇汪胜
  • 5篇吴晓伟

传媒

  • 18篇计算机系统应...
  • 15篇小型微型计算...
  • 10篇中国科学技术...
  • 7篇计算机工程
  • 5篇微电子学与计...
  • 3篇计算机应用与...
  • 2篇中国大学教学
  • 2篇计算机应用
  • 2篇计算机应用研...
  • 2篇教育与现代化
  • 2篇2008年全...
  • 1篇山西师大学报...
  • 1篇计算机学报
  • 1篇自动化与仪器...
  • 1篇软件学报
  • 1篇微型机与应用
  • 1篇计算机工程与...
  • 1篇文体用品与科...
  • 1篇计算机科学
  • 1篇物流工程与管...

年份

  • 3篇2024
  • 1篇2023
  • 4篇2022
  • 3篇2021
  • 2篇2020
  • 2篇2019
  • 5篇2018
  • 4篇2017
  • 6篇2016
  • 9篇2015
  • 2篇2013
  • 6篇2012
  • 4篇2011
  • 8篇2010
  • 5篇2009
  • 11篇2008
  • 4篇2007
  • 3篇2006
  • 8篇2005
  • 1篇2004
100 条 记 录,以下是 1-10
排序方式:
魂芯DSP上复数类型的支持和优化被引量:2
2017年
魂芯DSP是一款采用VLIW和SIMD架构的针对高性能计算领域而设计的32bit静态标量数字信号处理器.为了满足数字高性能计算的性能要求,魂芯DSP提供了丰富的复数指令,而编译器不能直接利用这些复数指令来提升编译性能.因此针对魂芯DSP芯片提供了大量的复数类操作指令的特点,在传统开源编译器Open64的编译框架基础上进行研究,实现了复数作为编译器基础类型和复数运算操作的支持.同时,通过识别特定的复数类操作的模式利用魂芯DSP上的复数类指令对程序编译优化.实验结果表明,该实现方案在魂芯DSP编译器上对复数程序优化后能够取得平均5.28的加速比.
王玉林郑启龙赵高义
基于RapidIO的多DSP互联仿真实现被引量:5
2020年
RapidIO协议作为数据通信协议之一在嵌入式系统开发中具有重要作用,适合短距离,需要多处理单元合作的应用场景,例如多DSP构成的板卡系统.BWDSP芯片作为一款高性能数字信号处理器,其丰富的计算资源在雷达信号处理等领域具有重要潜力.硬件设计开发中,直接采用已有数据通信协议很难适配具体硬件资源导致最终产品的数据传输性能较低.因此需要结合具体硬件模型,进行数据通信交换模型仿真建模设计,提高数据传输效率.本文首先介绍了RapidIO协议和BWDSP体系架构,然后设计了基于SystemC语言的串行RapidIO交换模型,最后设计实现了BWDSP虚拟平台.本文设计的BWDSP虚拟平台功能符合实际RapidIO协议标准,对硬件产品开发具有一定指导意义.
蔡恒雨凤维杰丁上义卢茂辉郑启龙
关键词:RAPIDIOSYSTEMC
深度学习节点分配的遗传算法设计被引量:3
2021年
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性.
蔡恒雨郑启龙
关键词:动态遗传算法
基于神经机器翻译的模型反混淆方法
2024年
模型混淆是指将神经网络等价地转换为另一种形式,是一种高效且低成本的神经网络保护技术.为了发现模型混淆的缺陷,研究人员提出了模型反混淆技术,以期望改进模型混淆方法.然而,现有的模型反混淆技术研究较少,并且适用场景和反混淆效果有限.因此,本文提出一种基于神经机器翻译(neural machine translation,NMT)技术的模型反混淆方法.该方法将模型的反混淆任务建模成一个seq2seq的任务,首先对混淆模型进行更详细的序列表示,然后对权重参数中的混淆信息进行识别并处理,最后再使用基于NMT的模型进行反混淆翻译.实验结果表明,该方法弥补了已有方法的不足,能够有效地捕捉模型的混淆特征并对模型的架构进行恢复,可以作为一种模型反混淆的通用方案.
朱浪刘彬彬李嘉璇郑启龙
关键词:TRANSFORMER
推测执行技术在HPMR系统通信优化中的应用被引量:2
2010年
HPMR(high performance MapReduce)系统是一个采用MapReduce模型的高性能计算软件支撑平台.在进行高性能计算时,HPMR往往需要很多轮Map-Reduce过程,中间的通信过程由KV路由和KV传输组成.KV传输依照KV路由阶段产生的KV路由表进行.HPMR程序的典型通信特征是每一轮的KV传输以高概率使用上一轮的KV路由表.根据这一特点,提出在HPMR的通信模型中引入推测执行技术,由此减少了KV路由的次数,使得HPMR的通信性能得到大大地提升.
王昊王向前郑启龙
关键词:MAPREDUCE
一种先进的扁平化谓词及编译优化方法
2019年
谓词执行是有效挖掘控制流程序指令级并行性的一种机制.经典的谓词实现一般局部地逐个进行谓词计算而不能进行多谓词控制,有谓词计算路径过长等问题.针对经典谓词存在的问题,提出一种先进的扁平化谓词的实现方法,这种扁平化谓词可以全局地进行谓词计算,可以自然地进行多谓词控制.在此基础上,研究扁平化谓词的编译优化方法,给出了扁平化谓词编译优化框架.实验表明,本文提出的扁平化谓词及编译优化框架可以很好地提高多条件控制程序的执行效率.
王向前郑启龙张仁高韩东科
关键词:谓词
基于BWDSP众核的CNN计算任务划分优化被引量:2
2019年
作为深度学习算法之一的卷积神经网络在多个领域有着重要的应用.因为其网络模型的规模和结构比较复杂,数据量较大,故需要考虑降低其对计算资源的要求.一般地,对于大数据量的计算任务,需要使用数据并行的方法进行任务的划分计算,而仅使用数据并行而对计算的任务的特点不加以结合,其数据传输量较高.因此需要通过对CNN网络结构及其计算特性的分析,设计合理的计算任务划分策略,减少数据的传输量.本文首先介绍了深度学习加速器中对计算任务的优化处理,接着介绍BWDSP的众核深度学习加速器的体系架构,并设计计算划分策略,基于VGGNet-16网络模型进行实验对比分析.实验结果表明该优化算法可以显著的提高数据传输的性能,降低数据的传输量.
王改郑启龙邓文齐杨江平卢茂辉
关键词:数据并行卷积神经网络
分块内存的数据分布优化被引量:1
2015年
为了提高访存效率,提供可以与计算流水线并行执行的多个独立的访存流水线,魂芯DSP片上存储器设计时采用分块内存结构,并在核内提供多个独立的地址生成单元用于访存操作.针对分块内存的结构特点,编译器对程序中的存储访问构建关于变量的冲突图,对分块内存进行存储块分配,优化数据在分块内存的分布.以数据在分块内存的优化分布为基础,指导程序中访存操作在地址生成单元的优化分配,使得编译器生成的代码可以最大程度地挖掘程序中数据访问的并行性.实验表明,基于分块内存的数据分配分布优化为其它优化如地址寄存器的分簇、访存向量化、软件流水等经典优化提供了良好基础,保证了编译器生成的代码可以充分发挥魂芯DSP提供的指令级并行能力.
王向前洪一郑启龙
关键词:数据分布
神经网络化简非多项式混合布尔算术表达式被引量:1
2023年
混合布尔算术表达式是指混合使用了位运算符和算术运算符的表达式,其是一种先进的软件混淆技术.现有的反混淆方法虽然能够化简特定类型的混合布尔算术表达式,但是对非多项式混合布尔算术表达式仅有有限的化简效果.本文提出一种字符串到字符串的解决方案NeuSim,它通过神经网络来学习和化解非多项式混合布尔算术表达式.首先,本文分别构建基于序列到序列架构和图序列架构的神经网络模型.其次,本文生成一个大规模的非多项式混合布尔算术表达式数据集,它包含一百万个形式多样的表达式样本.在数据集上训练之后,NeuSim可以将一个非多项式混合布尔算术表达式化简为等价的简单表达式.实验结果表明,NeuSim的化简正确率是已有方法的8倍,并且其化简时间低于0.01秒.
刘彬彬凤维杰郑启龙李京
基于龙芯3号四核处理器的国产万亿次高性能计算机KD-60
陈国良张俊霞孙广中张国义徐云李春生郑启龙陈峰蔡晔毛睿刘刚罗秋明陆克中王海涛廖银张钟龙柏王录恩汪睿方维
该项目是在国家教育部“985工程”二期建设的“信息科技前沿理论与应用创新平台”项目支持下,由中国科学技术大学和深圳大学合作完成。KD-60在体系结构上属于支持CC-NUMA的SMP集群架构。整个系统包含80个以龙芯-3A...
关键词:
关键词:高性能计算机四核处理器服务器
共10页<12345678910>
聚类工具0