内容推荐 本书将命名实体识别技术应用到软件缺陷领域,对缺陷报告中的缺陷实体进行命名实体分类,以抽取缺陷报告中更多关键的信息,并将知识图谱相关技术应用到软件缺陷领域,从而刻画实体之间语义关系的网络,能够较为全面的表达出实体之间存在的依赖关系。本书引入命名实体识别,知识图谱等技术,面向知识图谱推理的可解释性,以期解决缺陷报告中的诸多问题和挑战。本书的工作一定程度上解决了缺陷报告识别的可解释性问题,缺乏关键词语义的问题,为弱人工智能迈向认知智能踏下了积极的一步。 目录 第l章 绪论 1.1 引言 1.2 命名实体识别 1.3 知识图谱 1.4 缺陷报告 1.4.1 软件缺陷定义 1.4.2 软件缺陷分类 1.4.3 软件缺陷报告 1.4.4 重复软件缺陷报告 1.4.5 安全缺陷报告 1.5 国内外研究现状 1.5.1 软件缺陷领域命名实体识别研究现状 1.5.2 知识图谱研究现状 1.5.3 重复软件缺陷报告检测方法分类研究 1.5.4 安全缺陷报告预测研究现状 1.6 本文主要内容 第2章 软件缺陷领域命名实体识别方法 2.1 引言 2.2 软件缺陷领域命名实体分类标准 2.3 基于随机森林上下文的命名实体识别方法 2.3.1 数据预处理 2.3.2 分类器模型算法 2.4 基于多级别特征融合的命名实体识别方法 2.4.1 多级别词嵌入层 2.4.2 BiLSTM与Attention层 2.4.3 CRF层 2.4.4 方法参数介绍 2.4.5 实验设计 2.4.6 实验结果及分析 2.5 基于BERT-BiLSTM-CRF、模型的软件缺陷命名实体识别方法 2.5.1 BERT模型 2.5.2 BiLSTM模型 2.5.3 CRF模型 2.5.4 BBC-NER软件缺陷命名实体识别方法 2.5.5 实验结果分析 2.5 本章小结 第3章 DB-CNN-NER重复软件缺陷报告检测方法 3.1 引言 3.2 卷积神经网络 3.3 基于CNN的重复软件缺陷报告检测方法 3.3.1 CNN提取软件缺陷报告特征 3.3.2 不同分类器模型对于重复软件缺陷报告检测的影响 3.3.3 文本数据长度对于重复软件缺陷报告检测的影响 3.3.4 过滤器大小对于重复软件缺陷报告检测的影响 3.3.5 元数据对于重复软件缺陷报告检测的影响 3.4 DB-CNN-NER方法 3.4.1 DB-CNN-NER模型构建 3.4.2 实验结果分析 3.5 本章小结 第4章 基于关键词语义的安全缺陷报告识别方法 4.1 引言 4.2 关键词语义知识图谱构建 4.2.1 数据获取与处理 4.2.2 实体抽取 4.2.3 关系抽取 4.2.4 实体统一 4.2.5 语义知识图谱存储 4.2.6 语义知识图谱可视化 4.3 基于知识图谱的安全缺陷报告识别方法 4.3.1 方法框架 4.3.2 基于规则的关键词提取 4.3.3 语义知识图谱子图建立 4.3.4 安全缺陷报告预测的实现 4.4 性能评估 4.4.1 数据集描述 4.4.2 基线方法 4.4.4 实验设计 4.4.5 实验结果与分析 4.5 本章小结 第5章 基于知识图谱的跨项目安全缺陷报告预测方法 5.1 引言 5.2 方法框架 5.3 数据集预处理 5.4 数据源准备 5.5 知识图谱的构建 5.5.1 实体语料库的生成 5.5.2 实体关系建立 5.5.3 知识存储 5.6 性能评估 5.6.1 评测对象 5.6.2 基线方法 5.6.3 检测方法 5.6.4 实验设计 5.6.5 实验结果 5.6.6 实验结果分析讨论 5.7 本章小结 第6章 总结与展望 6.1 总结 6.2 未来工作与展望 参考文献 |