![]()
内容推荐 本书是一本关于数据流挖掘与在线学习算法的著作,该书全面、系统阐述了数据流机器学习的模型、算法、平台与实例。全书共10章,分为4个部分:第1部分包括第1~3章,介绍数据流机器学习基础知识;第2部分(第4~6章)介绍基于频繁模式的数据挖掘与在线学习算法;第3部分是基于模型的在线学习算法,包括第7章在线稀疏学习模型和第8章在线低秩表示模型;第4部分(第9、10章)介绍基于实例的数据流概念演变检测和在线学习算法。对每种典型在线学习算法的背景、模型定义、算法设计思想以及相关实验分析等,书中都有都完整的阐述。同时,也详细分析了一些与在线学习密切相关的离线数据挖掘和机器学习算法与应用。 本书的实验平台开源、简单易用。每章后面都设计了操作性强的课程实验。在图书“下载专区”目录下,免费提供了本书代码和相关教学配套资源的在线浏览与下载。 本书适合作为高等学校数据科学与大数据应用、智能科学与技术、人工智能等专业本科生和研究生的教材与教学参考书,也可供研究数据流挖掘与在线学习算法的科技人员阅读和使用。 目录 前言 第1章 数据流机器学习 1.1 大数据的两种计算模式 1.1.1 大数据离线分析 1.1.2 批量处理方法 1.1.3 大数据实时分析 1.1.4 在线学习方法 1.2 离线分析平台Weka 1.2.1 数据挖掘和机器学习 1.2.2 图形用户界面 1.2.3 ARFF格式与示例数据集 1.2.4 预处理过滤器 1.2.5 属性选择 1.2.6 可视化 1.3 数据流挖掘 1.3.1 数据流挖掘循环过程 1.3.2 分类器评估 1.3.3 分类方法 1.3.4 回归 1.3.5 聚类 1.3.6 频繁模式挖掘 1.4 数据流变化处理方法 1.4.1 数据流分布统计测试 1.4.2 概念漂移数据流产生 1.4.3 漂移评估与探测 1.4.4 自适应滑动窗口 1.4.5 数据流特征高维问题 1.4.6 噪音数据流处理 1.5 大规模在线分析平台MOA 1.5.1 图形用户界面 1.5.2 命令行操作 1.5.3 数据源和数据流生成器 课程实验1 实验平台安装与操作 1.6.1 实验目的 1.6.2 实验环境 1.6.3 安装平台 1.6.4 平台操作 参考文献 第2章 MOA平台机器学习实例 2.1 MOA分类 2.1.1 MOA分类器 2.1.2 朴素贝叶斯增量分类器 2.1.3 Hoefrding自适应窗口树 2.1.4 MOA分类实战操作 2.2 集成分类实例 2.2.1 装袋算法 2.2.2 提升算法 2.2.3 随机森林算法 2.2.4 MOA集成实战操作 2.3 MOA聚类 2.3.1 MOA聚类设置 2.3.2 DBSCAN密度聚类 2.3.3 Den-Stream数据流聚类 2.3.4 MOA聚类实战操作 2.4 频繁闭合项集挖掘算法 2.4.1 MOA扩展包 2.4.2 MOA加载配置IncMine扩展包 2.4.3 Java调用IncMine对象和选项 2.4.4 Eclipse环境下开发IncMine代码 课程实验2 数据分类 第3章 数据流在线学习模型与典型算法 第4章 离线挖掘频繁闭合项集 第5章 频繁子序列与基因表达数据双向聚类 第6章 数据流显露模式与贝叶斯分类 第7章 在线特征稀疏学习 第8章 低秩表示在线学习 第9章 可变数据流重复类与新类检测 第10章 KNN自适应存储处理异质概念漂移 |