![]()
内容推荐 本书较完整地讲解了数据挖掘和机器学习的基本概念、基本算法原理和应用技术。本书用通俗的语言和实例解释了抽象的概念,并将抽象概念融合到具体的案例中,以便于读者理解和掌握。 本书在编写过程中力求做到语言精练、概念清晰、取材合理、深入浅出、突出应用,为读者进一步从事数据分析、应用、开发和研究奠定坚实的基础。 本书既可作为高等院校信息类和管理类专业的数据挖掘或机器学习课程的教材,也可作为科研人员、工程师和数据分析爱好者的参考书。 目录 第1篇 基础篇 第1章 数据挖掘概述 1.1 什么是数据挖掘 1.1.1 数据、信息、知识和智慧 1.1.2 数据挖掘的定义 1.1.3 数据挖掘的功能 1.1.4 数据挖掘的发展简史 1.2 数据挖掘的基本步骤及方法 1.2.1 数据挖掘的基本步骤 1.2.2 数据挖掘的任务 1.2.3 数据挖掘的分析方法 1.3 数据挖掘与统计学的关系 1.3.1 数据挖掘与统计学的联系 1.3.2 数据挖掘与统计学的区别 1.4 数据挖掘与机器学习的关系 1.4.1 数据挖掘与机器学习的联系 1.4.2 数据挖掘与机器学习的区别 1.5 数据挖掘的十大经典算法 1.6 数据挖掘的典型应用 习题1 第2章 Python数据分析基础 2.1 Python程序概述 2.1.1 基础数据类型 2.1.2 变量和赋值 2.1.3 操作符和表达式 2.1.4 字符串 2.1.5 流程控制 2.1.6 用户函数 2.1.7 lambda函数 2.2 Python常用的内置数据结构 2.2.1 列表 2.2.2 元组 2.2.3 字典 2.2.4 集合 2.3 正则表达式 2.3.1 概述 2.3.2 常用方法 2.3.3 提取网页中的信息 2.4 文件的操作 2.4.1 文件的打开与关闭 2.4.2 文件的读/写操作 2.4.3 文件的其他操作 习题2 第3章 Python数据挖掘中的常用模块 3.1 NumPy模块 3.1.1 NumPy数据类型 3.1.2 NumPy基本运算 3.1.3 生成随机数的常用函数 3.1.4 对象转换 3.1.5 数组元素和切片 3.2 Pandas模块 3.2.1 Pandas中的数据结构 3.2.2 DataFrame的基本属性 3.2.3 DataFrame的常用方法 3.2.4 DataFrame的数据查询与编辑 3.2.5 Pandas数据的四则运算 3.2.6 函数变换 3.2.7 排序 3.2.8 汇总与统计 3.2.9 数据的分组与统计 3.2.10 Pandas数据的读取与存储 3.3 Matplotlib图表绘制基础 3.3.1 Matplotlib简介 3.3.2 Matplotlib绘图基础 3.3.3 使用Matplotlib简单绘图 3.3.4 文本注解 3.4 Scikit-learn 3.4.1 Scikit-learn的主要功能 3.4.2 Scikit-learn自带的小规模数据集 3.4.3 使用Scikit-learn生成数据集 3.5 股票数据的简单分析 3.5.1 抓取股票数据 3.5.2 股票数据的各指标折线图 3.5.3 各股票的5分钟涨幅柱状图 3.5.4 股票各指标之间的关系对比 …… 第2篇 数据预处理篇 第3篇 数据挖掘算法描述和应用篇 第4篇 后续学习引导篇 参考文献 |