杨立东
- 作品数:70 被引量:158H指数:7
- 供职机构:内蒙古科技大学更多>>
- 发文基金:国家自然科学基金内蒙古自治区自然科学基金内蒙古自治区高等学校科学研究项目更多>>
- 相关领域:自动化与计算机技术电子电信医药卫生文化科学更多>>
- Fourier变换的工程例证式教学法探索被引量:2
- 2020年
- Fourier变换是复变函数中一个重要的理论,由于其高度的抽象性使得学生对Fourier变换的概念、性质和应用都缺乏直观的认识和深刻的理解.结合信号与系统和数字图像处理中的实例,开展Fourier变换的工程例证式教学法研究.对于数学专业学生,该方法不仅有助于加深对Fourier变换的理解,而且有利于提升学习兴趣和实践能力.
- 郭勇杨立东
- 关键词:傅里叶变换复变函数
- 现代通信网课程体系的改革被引量:3
- 2008年
- 通信网对于现今社会的作用是举足轻重的,在本科教学中现代通信网也成为了一门重要的课程,本文总结了对现代通信网课程体系在教学环节和实验环节中改革的过程和方法,最后起到了满意的教学效果。
- 秦岭杜永兴杨立东高鹭
- 关键词:现代通信网教学
- 一种基于张量分解的语音信号特征提取方法
- 本发明公开了一种基于张量分解的语音信号特征提取方法,属于语音信号处理技术领域。将分帧后的语音信号进行多层小波分解,对小波分解后得到的多个分量信息分别提取美尔频谱倒谱系数及所对应的一阶差分系数和二阶差分系数组成特征参数矢量...
- 杨立东王晶
- 多帧医学图像与流媒体格式转换技术研究被引量:1
- 2012年
- 目的将符合医学数字成像和传输(DICOM)标准的多帧医学图像转换成常用的流媒体格式文件。方法解析DI-COM多帧医学图像结构,设计相关解析算法,将DICOM多帧图像中的像素数据写入流媒体文件中。结果成功实现将DICOM多帧图像转换为AVI和WMV两种流媒体格式。转换后发现AVI格式影像清晰,体积与DICOM文件几乎等同;WMV格式是有损压缩格式,体积极小,可以节省大量存储空间。结论格式转换后非常适合网上播放和传输,因此对初步的远程医疗与疾病的及时诊断具有非常重要的意义。
- 谷宇杨立东赵建峰张宝华喻大华任晓颖钱倩
- 关键词:流媒体WMV
- 一种高精度双层优化方法的神经网络搜索架构构建方法
- 本发明公开了一种高精度双层优化方法的神经网络搜索架构构建方法。在搜索空间中对操作感受野的倾向扩展操作空间只选择倾向的感受野;构建并堆叠普通搜索单元和下采样搜索单元,形成超网;通过高精度双层优化方法搜索得到超网的有向无环图...
- 谷宇王满晟杨立东张宝华刘新李建军黄显武
- 基于张量分解的多声道音频恢复方法
- 2015年
- 为恢复多声道音频在采集过程中丢失的数据,提出基于加权优化的张量分解方法.首先用张量对音频建模,并且根据其尺寸定义一个标识数据丢失位置的加权张量,然后使用加权最小二乘问题描述CANDECOMP/PARAFAC(CP)模型并通过一阶优化算法求解,最终通过获得的因子矩阵恢复音频.通过不同数目通道数据丢失的隐藏参考和基准的多激励测试,说明针对丢失数据采用CP分解方法是有效的,即张量分解能够得到较好的音频恢复效果.
- 杨立东王晶赵毅谢湘匡镜明
- 关键词:张量分解
- 面向虚拟现实场景的房间脉冲响应计算模型
- 2024年
- 提出了一种面向虚拟现实应用场景的房间脉冲响应计算模型,将深度学习神经网络技术与心理声学感知参数结合,能够高效地从虚拟现实场景信息中预测具有听觉感知意义的房间脉冲响应。在确保高质量预测结果的同时,该模型可以满足虚拟现实音频场景中生成房间脉冲响应所需的实时性、高采样率、非受限长度和轻量化的要求。模型首先通过图卷积神经网络将场景中的声学信息编码,然后通过神经声场与转置卷积模型将声学信息解码得到房间脉冲响应感知参数,最后根据房间脉冲响应感知参数恢复出房间脉冲响应信号。实验结果表明,所提模型在房间脉冲响应生成质量、计算开销以及功能性方面都有较大的优势,可较好地满足虚拟现实音频对于实时生成房间脉冲响应的需求。
- 李知禹王晶岳欣雯杨立东赵胜辉谢湘
- 关键词:房间脉冲响应虚拟现实
- 基于注意力机制的多用户全景视频视口预测被引量:1
- 2025年
- 近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当前,主流的视口预测方案多是利用观看者的视点轨迹和画面内容,结合神经网络输出结果,并进行评估。现有的方法大多不能在长时间预测取得较好的效果,且没有充分利用多用户场景下的数据。为此,本文借鉴了目前流行的Transformer网络中的注意力机制,提出了一种在多用户场景下预测未来较长时间视口的方案。由于不同用户在观看同一视频的视点轨迹具有相似性,本文首先提出了一种多用户视口轨迹相似性比较方案,该方案利用目标用户的视口轨迹数据和历史用户的视口轨迹数据预测目标用户未来视口轨迹数据。其次,由于全景视频视口轨迹存在着不连续性,本文对不连续视口轨迹进行映射处理来解决单次预测轨迹数据不连续的问题,在实验中使用此方法处理数据集的效果较好。最后,本文通过实验对比了两个近年提出的具有相似输出的模型,结果显示本文提出的全景视频预测算法在平均绝对误差、曼哈顿距离以及本文提出的角度距离误差指标下有所减少,部分指标减少超过10%。这说明本文提出的方案能在较长时间视口预测取得更高的精度,引入注意力机制和多用户相似性比较有助于提升模型性能和泛化能力。
- 张汉琦黄聪宇王晶李知禹杨立东
- 关键词:全景视频虚拟现实神经网络
- 一种音频场景分类方法及装置
- 本发明涉及音频信号处理技术领域,具体涉及一种音频场景分类方法及装置,本发明使用Tucker分解与张量回归的音频分类模型,该模型首先对log‑mel数据增强扩充数据集;利用tucker分解降低卷积权重的冗余度,使数据可以更...
- 杨立东岳任博郭勇
- 头部相关传递函数获取关键技术研究被引量:1
- 2019年
- 虚拟现实技术(VR)的飞速发展使双耳听觉研究越来越深入,如何快速准确地获取个性化头部相关传递函数HRTF成为研究热点。介绍了HRTF获取关键技术研究现状,总结出HRTF的4种获取方式:实验测量法、数学建模法、数据库匹配法和主观选择法,并阐述各方法的基本原理。将各方法进行对比,指出HRTF获取工作中需解决的问题和未来研究方向。
- 杨立东焦慧媛
- 关键词:HRTF