李岩
- 作品数:32 被引量:44H指数:5
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:中央级公益性科研院所基本科研业务费专项资金项目国家自然科学基金国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术经济管理更多>>
- 基于社区隶属度的文本主题可视化方法、装置
- 本申请实施例提供了一种基于社区隶属度的文本主题可视化方法、装置。该方法包括:获取待处理文本的主题词以及主题词的共现信息;确定主题词的社区划分结果;基于共现信息以及社区划分结果,确定各主题词的社区隶属度;基于共现信息以及各...
- 李岩高影繁刘志辉崔笛浦墨郑明
- 基于政社舆情的公众关注与政策关注差异分析
- 2022年
- 本文分析公众关注与政策关注的差异性。利用从《国家重点支持的高新技术领域》文件的第二大类高新技术领域文本中提取出的关键技术主题词,检索并分析相关舆情数据。发现民众对“生物与新医药”领域的关注点主要集中在“医药生物技术”“医疗仪器、设备与医学专用软件”以及“化学药研发技术”这三个技术领域。相较于政策内容关注的重点而言,民众关注的内容更贴近民生。
- 姚新浦墨李岩高影繁刘志辉
- 台风眼效应中的突发事件舆情数据分析方法
- 2020年
- 心理学家用"台风眼效应"表征人们离危机事件中心的距离越远、反应越强的心理现象。突发事件发生以后,网络舆情数据通常会呈现铺天盖地、汹涌澎湃之势。在这种情况下,如何去除舆情数据中的心理、情绪等主观信息,为民众中的不同层次主体呈现客观的事件描述,缓解由于信息不对称所带来的台风眼效应问题成为了一个有价值的研究课题。本文结合科技文本的短语识别方法,通过突发事件典型特征词与科技类短语的联合检索实现对舆情信息的过滤,利用可视化主题聚类和热点分析工具实现了对突发事件舆情数据的客观描述,为台风眼效应中信息不对称问题的解决提供了新思路。
- 高影繁李岩浦墨郑明翟云
- 关键词:信息不对称短语识别
- 基于专利的技术竞合网络构建及其产业分析应用研究
- 研究背景和意义:随着全球经济的日益竞争,技术创新已经成为企业和产业发展的核心动力。特别是在知识经济时代,专利数据作为反映技术创新的重要信息源,受到了广泛的关注。专利数据中蕴含着丰富的技术信息,其标题和摘要文本可以很好地表...
- 李岩高影繁崔笛浦墨袁鸣
- 文本相似性分析方法、装置、电子设备及计算机存储介质
- 本申请涉及文本处理领域,公开了一种文本相似性分析方法、装置、电子设备及计算机可读存储介质,其中,文本相似性分析方法包括:确定目标文本的第一预设个数的基础特征词;接着基于训练后的文本词向量库,对第一预设个数的基础特征词分别...
- 高影繁姚长青刘志辉崔笛李岩郑明
- 专利与企业相关性测度方法、装置、设备及可读存储介质
- 本申请实施例提供了一种专利与企业相关性测度方法、装置、设备及可读存储介质。该方法包括:获取企业专利文本中的专利特征词;确定各专利特征词在企业专利文本中的权重值;根据企业专利文本所属企业的企业描述文本,以及专利特征词,确定...
- 高影繁刘志辉姚长青李岩崔笛郑明
- 基于分类体系的上市公司年报信息披露质量研究——以我国A股上市公司为例被引量:9
- 2019年
- 随着信息化进程的加快和大数据时代的到来,数据和信息已成为国家重要的战略资源,信息质量也成为影响其社会和经济价值的重要因素。目前,关于企业年报的信息质量问题正受到业界的密切关注。本研究从竞争情报分析和应用的视角出发,以国内A股上市公司年报为研究对象,通过构建上市公司年报非财务数据分类体系,开展基于分类体系的上市公司年报信息披露质量研究。研究发现,国内A股上市公司年报的信息披露质量正随着监管制度的反复修订和完善而逐渐提升,且以"核心竞争力"、"风险认知"和"供应链"这三类信息披露质量提升最为显著;各行业在企业竞争力分析的核心关键信息披露质量上差异较大,且以制造业及信息传输、软件和信息技术服务业的整体质量最高,而房地产业、金融业、教育等非实体经济行业和低技术附加值行业的信息质量则相对较低;在披露问题方面,主要存在供应商或客户名称较隐晦、地区表述不规范、产品名称不清晰等诸多问题。未来仍需加强相关监管和规范,尝试有针对性地建立分类模型和规范,以从根本上提高年报信息披露质量,从而更好地服务于以细粒度知识为基础的产业和企业竞争情报深度分析。
- 崔笛郑明李岩刘志辉
- 关键词:信息质量年报
- 一种面向特定领域专利实施例的命名实体识别方法
- 本申请实施例提供了一种面向特定领域专利实施例的命名实体识别方法,涉及自然语言处理技术领域。该方法包括:获取待识别数据;采用预训练的第一识别模型对待识别数据进行识别,确定与待识别数据对应的命名实体;其中,第一识别模型是基于...
- 李岩高影繁刘志辉
- 基于科技文献的锡铟材料知识图谱构建研究
- 2024年
- 随着科技文献数量的爆发性增长,垂直领域的企业面临着知识服务的挑战。为了帮助新材料领域企业有效利用科技文献信息资源,迫切需要使用人工智能技术对包含的材料性能等关键知识的专利及学术论文进行深入的知识建模,提供知识获取效率和准确性。以锡铟贵金属领域的10.48万篇科技文献为数据源,构建领域知识本体,利用BERT+BiLSTM+CRF模型进行命名实体识别,利用BERT+BiGRU神经网络模型进行关系抽取,将抽取结果存入图数据库Neo4j中并构建锡铟贵金属材料领域的知识图谱。所构建的知识图谱拥有18.19万个实体节点和23.47万条关系,能够实现多粒度的材料实体和关系的关联查询与可视化。基于锡铟科技文献构建知识图谱的方法拓展了新材料领域知识图谱构建的研究思路,为开展基于科技文献的垂直领域智能知识问答等应用提供了坚实的基础。
- 李岩彭巨擘高影繁
- 关键词:材料学知识图谱命名实体识别关系抽取
- 专利技术核心度的确定方法、装置、电子设备及存储介质
- 本申请实施例提供了一种专利技术核心度的确定方法、装置、电子设备及存储介质,涉及数据处理领域。该方法包括:根据目标专利与预设数据库中除了目标专利之外的每项第一专利之间的相似度,确定目标申请人以及关联申请人中每个第一申请人的...
- 高影繁刘志辉李岩郑明仇实