内容推荐 本书是在笔者参与完成的10多个基于大数据的网络安全算法工程项目的基础上撰写而成的,主要包括针对网上海量中文文本的舆情发现、舆情跟踪与舆情分析问题,提出一系列分类算法、回归算法,设计与实现针对海量中文文本的网络数据挖掘分析系统。设计实现的网络数据挖掘分析系统已在安全部门和公安部门中得到了实际应用。该系统可以对信息中包含的内容进行分析,识别其对受保护对象(如公共安全、企业资产等)形成的风险,评估其包含的价值,提取其中的关键要素等,其具体功能包括自动保密审查(涉密风险识别)、舆情分析(声誉风险评估)和科技情报采集(信息价值评估与提取)等。该系统还可以对网络数据进行智能化分析,检测其中的异常行为,识别未知攻击,评估安全态势,设立安全基线等,其具体功能包括流量异常检测、用户行为异常识别和APT攻击防范等。 本书可供信息安全领域的广大科研工作者、工程技术人员阅读、参考。 目录 第1章 绪论 1.1 研究背景和研究意义 1.2 舆论操纵周期模型 1.3 国外相关研究项目 第2章 海量中文文本中热点序列的挖掘 2.1 引言 2.2 基于LCS的海量中文文本热点序列挖掘算法 2.3 LCSCS算法的改进 2.4 小结 第3章 海量中文文本中热点话题的挖掘 3.1 引言 3.2 词汇关联网络的构建 3.3 词汇关联网络的拓扑特性 3.4 词汇关联网络形成机制 3.5 词汇关联网络聚类 3.6 虚拟社团分析 3.7 小结 第4章 面向命名实体检索技术 4.1 命名实体识别技术 4.2 命名实体规范技术 4.3 命名实体检索模式与排名算法 4.4 小结 第5章 文本分类算法与工程应用 5.1 文档向量空间模型 5.2 基于Word2Vec的文本分类算法 5.3 非完全标注的文本分类训练 5.4 文本分类的单类学习算法 5.5 模型综合 5.6 工程应用 第6章 网络行为异常检测算法与应用 6.1 网络行为特征提取 6.2 异常行为检测算法 第7章 总结与展望 参考文献 |