内容简介
本书利用文本挖掘技术和信息分析方法对非专利引文关系中的论文和专利两类科学与技术文本的知识相关性进行系统研究,主要的研究内容如下:
(1) 梳理科学与技术间存在关联关系的理论依据、研究方法、技术手段,对基于非专利引文所确立的科学技术相关性研究现状进行评述并指出不足。
(2) 将研究对象限定在论文和专利两类科学和技术文本,并将非专利引文限定在技术专利对科学论文的引用上。以向量空间模型计算两类文本的知识相关性,采用大样本数据集对3D 打印技术领域非专利引文关系中的论文和专利的知识相关性进行检验,对非专利引文能否作为判定两类文本存在知识相关性的依据提供系统而全面的论证。
(3) 在四轮德尔菲专家调查法后归纳总结施引专利与被引论文间的知识相关类型,结合创新扩散、基于文献的知识发现理论,探讨与专利存在不同相关类型的科学研究成果如何辅助企业的技术创新实践,特别是如何加快具体技术问题的解决。在此基础上,分析以向量空间模型为基础的相关性计算结果对不同知识相关文本的度量效果,指出将高得分科学研究成果作为实现技术创新重要途径存在的问题与不足。
(4) 针对上述传统相关性计算方法中的不足,从信息抽取、知识表示、相关性度量三个方面入手,提出能够从非专利引文中识别具有创新应用潜力的科学研究的方法,包括用于专利和论文知识内容表示的关键词抽取算法、融合概念间语义信息的文本知识表示方法、论文与专利的知识相关性计算方法。
(5) 为了体现本书提出的相关性计算方法的优越性,以3D 打印技术领域的技术专利和科学论文为分析对象,介绍如何将该方法应用于企业的技术创新合作伙伴识别任务当中。重点揭示将该相关性结果作为合作伙伴评价指标对识别结果的影响,以此证明本书的方法在科学和技术文本知识相关性计算方面的可靠性。
章节目录
第1 章 导论/1
1.1 研究背景与研究问题/1
1.2 研究目标与研究意义/4
1.3 研究思路/7
第2 章 理论基础与研究综述/10
2.1 相关概念界定/10
2.2 科学与技术关联的理论基础/15
2.3 科学与技术的定量关联方法/20
2.4 基于非专利引文的科学技术关联研究/23
2.5 科学论文与技术专利的信息抽取方法/26
第3 章 非专利引文文本知识相关性的可靠性研究/37
3.1 假设的提出/38
3.2 数据采集与预处理/38
3.3 非专利引文的知识相关性的比较分析/45
3.4 基于非专利引文耦合的专利知识相关性检验/64
3.5 本章小结/67
第4 章 基于关键词网络的专利与论文知识内容提取/69
4.1 摘要文本的预处理与图表示方法/71
4.2 基于共现与语义连接的关键词加权方法/85
4.3 关键词抽取方法的比较与评估/90
4.4 本章小结/95
第5 章 非专利引文关系文本的知识相关性计算方法/96
5.1 问题描述与概念界定/97
5.2 异质信息网络生成与元路径设定/105
5.3 基于异质信息网络的专利与论文知识相关性计算/109
5.4 算法评估与讨论/118
5.5 本章小结/130
第6 章 科学与技术文本知识相关性的应用研究/131
6.1 基于技术专利的企业——技术领域关联分析/134
6.2 基于科学论文的科研机构——科学知识关联分析/146
6.3 3D 打印技术企业与科研机构的知识相关性计算/153
6.4 3D 打印技术企业的科研机构合作伙伴识别/157
6.5 本章小结/170
第7 章 研究结论与展望/172
7.1 主要研究结论/172
7.2 研究创新点与贡献/174
7.3 研究局限与展望/177
参考文献/179
附录/195
附录A:科学与技术文本知识相关类型调查问卷/195
附录B:德尔菲专家调查法第一轮反馈结果/196
索引/198