王海鹏
- 作品数:14 被引量:6H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家科技攻关计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术生物学理学医药卫生更多>>
- 一种蛋白质翻译后修饰的发现方法
- 本发明提供一种蛋白质翻译后修饰的发现方法,包括:利用蛋白质样品的实验串联质谱数据中的肽色谱保留时间以及肽质量计算所有谱图之间的谱图差异向量;建立可能包含修饰质量的候选修饰质量区间;在每个所述的候选修饰质量区间上,估计所述...
- 付岩贺思敏王海鹏孙瑞祥
- 文献传递
- pepReap:基于支持向量机的肽鉴定算法被引量:3
- 2005年
- 利用生物质谱技术进行肽蛋白质鉴定是蛋白质组学研究中的关键问题.提出了一种基于支持向量机(SVM)的肽鉴定算法pepReap.算法由粗细两层打分体系构成,粗打分利用匹配谱峰总强度和数目及肽长度等信息得到候选肽序列的列表,细打分通过SVM算法综合利用多项匹配指标如离子相关性、离子匹配误差、肽序列信息等对粗打分结果进行评价,得到更为可靠的肽鉴定结果.在SVM的参数选择过程中,采用马修斯相关系数来评价分类性能以适应不平衡数据集的情况.在公开发表的数据集上的实验表明,该算法与采用阈值评价方法的流行商业软件SEQUEST相比,在鉴定精度相当的情况下可以获得更高的鉴定灵敏度.
- 王海鹏付岩孙瑞祥贺思敏曾嵘高文
- 关键词:支持向量机蛋白质组学不平衡数据集参数选择
- 精准确定串联质谱母离子的单同位素峰质量
- 袁作飞刘超王海鹏付岩孙瑞祥贺思敏
- 文献传递
- 一种规模化蛋白质鉴定中的索引加速方法及相应的系统
- 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列...
- 李由李德泉王乐珩迟浩王海鹏付岩孙瑞祥贺思敏刘超袁作飞王文平秀丽蕴
- 文献传递
- 一种提高单同位素峰判断准确率的方法和系统
- 本发明公开了一种提高单同位素峰判断准确率的方法和系统。所述方法,包括下列步骤:根据选定的串联质谱,确定候选同位素峰簇;根据所述候选同位素峰簇的色谱流出曲线的相似度和强度比值,确定同位素峰簇的起止;根据所述同位素峰簇的起止...
- 袁作飞刘超王海鹏付岩孙瑞祥贺思敏
- 一种规模化蛋白质鉴定中的索引加速方法及相应的系统
- 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列...
- 李由李德泉王乐珩迟浩王海鹏付岩孙瑞祥贺思敏刘超袁作飞王文平秀丽蕴
- 蛋白质组质谱信息处理的关键算法研究
- 应用质谱数据进行蛋白质的定性鉴定与定量分析是蛋白质组生物信息学研究中的一个关键问题。由于质谱仪器类型的多样化,实验过程样本中混入杂质的干扰,不同实验室质谱实验参数的不同选取,实验人员的操作水平,以及人们目前对于离子碎裂机...
- 孙瑞祥付岩张京芬李德泉王海鹏蔡津津王晓彪曾嵘贺思敏高文
- 关键词:蛋白质组学质谱生物信息学蛋白质鉴定
- 文献传递
- 一种对字符串排序和查找的方法
- 本发明提供一种对字符串进行排序的方法,包括:为所要排序的所有字符串中的字符分类,为一个类别的字符赋予一个数值,不同类别的字符所赋予的数值互不相同;结合各个字符所赋予的值,采用哥德尔编码方法对所要排序的各个字符串分别进行编...
- 李由贺思敏付岩袁作飞迟浩王海鹏王乐珩孙瑞祥
- 文献传递
- 一种蛋白质翻译后修饰的发现方法
- 本发明提供一种蛋白质翻译后修饰的发现方法,包括:利用蛋白质样品的实验串联质谱数据中的肽色谱保留时间以及肽质量计算所有谱图之间的谱图差异向量;建立可能包含修饰质量的候选修饰质量区间;在每个所述的候选修饰质量区间上,估计所述...
- 付岩贺思敏王海鹏孙瑞祥
- 文献传递
- 用串联质谱中碎片离子的同位素峰预测离子分子式的方法
- 本发明公开了一种用串联质谱中碎片离子的同位素峰预测离子分子式的方法,该方法从串联质谱和从各元素的原子个数待定的通用分子式中分别获取碎片离子的单同位素的质量以及各同位素谱峰相对于单同位素的相对丰度;将分别获取的质量和相对丰...
- 高文张京芬蔡津津贺思敏曾嵘陈润生王海鹏
- 文献传递