![]()
内容推荐 本研究在梳理知识演化、知识生命周期等知识进化理论和思想的基础上,介绍了引文网络、Meta-path、PageRank等网络分析理论和方法,阐述了Word2vec、Doc2vec、Node2vec等深度表示学习模型以及ARIMA、SVM等时间序列模型,以期为科学主题的演化和热度预测提供理论基础和方法支撑;以生物医学与生命科学领域PubMed Central数据全集为例,基于知识图谱技术构建了一种面向计量相关研究和应用的垂直领域知识图谱——计量知识图谱;创新计量指标,计算计量实体的热度,用热度值反应主题所处的演化状态;采用一系列深度学习等方法挖掘科学主题在计量知识图谱中的特征,分析科学主题的演化规律;基于SVM、ARIMA、LSTM等一系列时间序列模型构建学科主题预测模型,优化、验证模型,并进行应用研究。读者对象:高等学校信息科学、情报学、信息管理等相关专业的学生,以及从事科技情报、知识管理、知识服务的实际工作者 目录 第一章 绪论 1.1 研究背景与意义 1.1.1 研究背景 1.1.2 研究意义 1.2 国内外研究现状 1.2.1 主题模型研究 1.2.2 主题演化研究 1.2.3 主题预测研究 1.2.4 知识图谱 1.2.5 表示学习 1.2.6 现状述评 1.3 研究内容与方法 1.3.1 目标与内容 1.3.2 研究方法 1.3.3 研究难点 1.4 研究贡献 第二章 理论基础 2.1 知识进化论 2.1.1 知识演化 2.1.2 知识生命周期 2.2 网络分析理论与方法 2.2.1 引文网络 2.2.2 Metapath 2.2.3 PageRank 2.3 深度表示学习模型 2.3.1 Word2vec模型 2.3.2 Doc2vec模型 2.3.3 Node2vec模型 2.4 时间序列模型 2.4.1 ARIMA模型 2.4.2 支持向量机模型 第三章 知识图谱构建 3.1 计量知识图谱内涵 3.1.1 计量知识图谱 3.1.2 动态计量知识图谱 3.2 计量实体与关系 3.2.1 数据下载 3.2.2 计量实体抽取 3.2.3 计量实体消歧 3.2.4 计量实体关系 3.3 MeSH中的实体与关系 3.3.1 MeSH知识库 3.3.2 MeSH解析 3.4 计量实体与MeSH实体关联 3.4.1 全文检索Lucene 3.4.2 基于pylucene的计量实体与MeSH实体关联 3.5 计量知识图谱时间划分与构建 3.6 本章小结 第四章 实体热度计算 4.1 热度计算 4.1.1 热度内涵 4.1.2 基于加权PageRank的热度计算方法 4.2 论文热度计算 4.2.1 论文热度内涵 4.2.2 基于PaperRank的论文热度计算 4.3 学科主题热度计算 4.3.1 学科主题热度内涵 4.3.2 学科主题引证网络构建 4.3.3 基于TopicRank的学科主题热度计算 4.4 作者热度计算 4.4.1 作者热度内涵 4.4.2 作者引证网络构建 4.4.3 基于AuthorRank的作者热度计算 4.5 期刊热度计算 4.5.1 期刊热度内涵 4.5.2 期刊引证网络构建 4.5.3 基于VenueRank的期刊热度计算 4.6 本章小结 第五章 学科主题演化分析 5.1 学科主题演化 5.2 学科主题分布 5.2.1 学科主题的总体分布情况 5.2.2 有副主题限定词的主题分布 5.2.3 无副主题限定词的主题分布 5.3 学科主题表示学习 5.3.1 基于网络结构的学科主题表示学习 5.3.2 基于文本内容的学科主题表示学习 5.4 学科主题聚类和演化分析 5.4.1 聚类方法概述与选取 5.4.2 基于Jaccard系数的相似度计算方法 5.4.3 Methods类主题演化规律 5.4.4 Drug effect类主题演化规律 5.4.5 Epidemiology类主题演化规律 5.5 本章小结 第六章 学科主题热度预测 6.1 学科主题热度预测 6.2 学科主题特征选择 6.2.1 池化模型 6.2.2 基于Node2vec和池化模型的学科主题特征选择 6.3 基于SVM的学科主题热度预测 6.3.1 问题描述 6.3.2 研究设计 6.3.3 结果分析 6.4 基于ARIMA和SVM的学科主题热度预测 6.4.1 问题描述 6.4.2 研究设计 6.4.3 结果分析 6.5 本章小结 第七章 总结与展望 7.1 研究总结 7.2 研究不足与展望 附录A 动态计量知识图谱 附录B 图表目录 参考文献 |