倪伟
- 作品数:55 被引量:16H指数:2
- 供职机构:合肥工业大学更多>>
- 发文基金:机械工业技术发展基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学机械工程更多>>
- 基于Winograd算法的卷积神经网络硬件加速器及计算方法
- 本发明公开了一种基于Winograd算法的卷积神经网络硬件加速器及计算方法,该加速器包括:输入缓冲模块、PE阵列、后处理模块,数据分配器、控制模块、配置模块、输出缓冲模块、存储层;配置模块将指令译码成配置信息;控制模块用...
- 倪伟袁子昂冉敬楠宋宇鲲张多利
- 一种基于ANMS算法的LDPC译码器和译码方法
- 本发明提供一种基于ANMS算法的LDPC译码器和译码方法,其中,该译码器包括:配置信息模块201、校验节点更新模块202,变量节点更新模块203、译码判决模块204、控制模块205,其中译码判决模块204针对数据路M1和...
- 倪伟陈世宇沈瑞民刘凯迪艾春搏张多利宋宇鲲
- 利用中心点排序的矩形窗可变二维OS-CFAR检测装置及方法
- 本发明提出一种利用中心点排序的矩形窗可变二维OS‑CFAR检测装置及方法,包括S1,在二维距离多普勒功率矩阵基础上设置检测窗口,获取检测窗口中列向量;S2,对边缘数据进行补边;S3,将当前中心待检测单元数据和邻近的多次检...
- 张多利陶相颖曾树铭宋宇鲲倪伟
- 基于层间和层内混合精度运算的深度神经网络加速器系统及计算方法
- 本发明公开了一种基于层间和层内混合精度运算的深度神经网络加速器系统及计算方法,包括主控制器、指令存储器、权值缓存地址控制器、特征图缓存地址控制器、高位数据编码索引表、权值缓存模块组、特征图缓存模块组、乘累加阵列和量化器组...
- 倪伟冉敬楠陈世宇宋宇鲲张多利
- 一种基于队列的控制字输出反馈控制方法
- 本申请公开了一种基于队列的控制字输出反馈控制方法,涉及多核处理器任务输出管理的技术领域,包括以下步骤,首先接收任务调度单元输出的有序控制字,写入Exit队列,确定入队个数,其次Exit队列中控制字依次输出,记录出队个数,...
- 宋宇鲲葛虎孔令超郭子威张多利倪伟
- 渗透剂在纤维布中的渗透率测试装置及测试方法
- 本发明公开了一种渗透剂在纤维布中的渗透率测试装置,包括工作台,所述工作台的顶面依次固定设置有纤维布放卷机构,用于纤维布的定长放卷,实现测试材料的连续供给;打孔裁剪机构,用于放卷后的纤维布的顶面打孔及定长裁切,实现测试材料...
- 陈世军祖磊曹学文张桂明倪伟邓少杰张骞吴乔国李德宝王华毕
- 基于CORDIC的三角函数流水线迭代求解方法和装置
- 本发明提出基于CORDIC的三角函数流水线迭代求解方法,包括以下步骤:步骤S1:根据待求解的输入角所在象限确定当前角的角度和坐标值;步骤S2:将当前角与输入角进行比较并旋转,生成新角;步骤S3:判断新角是否与输入角重叠或...
- 张多利魏可陶相颖宋宇鲲倪伟
- 一种改进的初相注入的定时同步方法
- 本发明提供了一种改进的初相注入的定时同步方法,包括S1,对输入信号进行平方滤波定时误差估计,获取平方滤波定时误差值;S2,将上述平方滤波定时误差值作为Gardner定时环路插值点的初始位置,对插值后得到的最佳采样数据进行...
- 郑悦然宋宇鲲孔令超艾春搏倪伟
- 基于轻量型网络的卷积神经网络硬件加速器及其计算方法
- 本发明公开了一种基于轻量型网络的卷积神经网络硬件加速器及其计算方法,该加速器包括:特征图全局缓冲模块、控制模块、输入缓冲模块、权重缓存模块、核心计算模块、中间值缓存模块;该核心计算模块包括:有效索引生成单元、有效索引控制...
- 倪伟储萍宋宇鲲张多利
- FPGA加速器深度卷积神经网络优化计算方法被引量:2
- 2022年
- 传统方法在进行深度卷积神经网络优化时,存在计算能力能力不佳、加速器加速效果不明显的问题。为此设计一种FPGA加速器深度卷积神经网络优化计算方法。通过AlexNet模型分析深度卷积神经网络结构,确定深度卷积神经网络参数;引入FPGA设计加速器,利用拆分计算实现更细粒度卷积分解的并行计算;通过流水线处理计算所有的卷积层,分别对卷积计算模块中的卷积处理单元、线性缓存单元、池化单元与激活单元进行优化加速处理,提升FPGA加速器的卷积计算速度,利用FPGA加速器实现优化计算。实验结果表明,设计的方法能够有效提升加速效果,降低资源消耗率,MAC效率较高,适合大力推广使用。
- 梁修壮倪伟
- 关键词:加速器