![]()
内容推荐 本书从最基本的理论知识出发,首先介绍了Python这一数据挖掘工具的基本用法;其次以它为载体,介绍了大数据的数据探索方法、数据预处理、数据描述统计分析等方法;随后,为了增强本书读者对目前常用的热门算法的了解,本书深入浅出地介绍了包括回归、分类、聚类等在内的机器学习算法和深度学习算法。此外,在介绍上述理论知识和算法时,为了帮助读者对书中所介绍的知识与方法的理解,编者在书中的各章都嵌人了大量的交通案例,展示如何将各类算法模型应用到交通实践当中。 本书主要面向的是交通运输工程专业本科高年级学生,以及硕士、博士新生等交通数据分析的初学者。为了进一步增强此类学生的交通大数据挖掘实战能力,本书将以网约车轨迹数据为例,从数据采集、数据探索、数据预处理、数据信息挖掘、数据结果分析、数据可视化展示等过程,更加清晰地介绍交通大数据的具体处理和分析方法,增强交通大数据理论知识的可解释性。 作者简介 刘志远,东南大学青年首席教授,澳大利亚蒙纳士大学客座教授。目前担任东南大学交通学院副院长、教授、博导,复杂交通网络研究中心主任,获评国家自科基金优青、江苏省双创人才、江苏省青年双创英才、东南大学“五四青年奖章”。长期从事交通大数据分析与建模、交通网络规划与管理、公共交通等领域的研发工作。 目录 第1章 绪论 1.1 本书的定位 1.1.1 背景 1.1.2 本书特点 1.1.3 本书目标 1.1.4 本书内容提要 1.2 本书的基础 1.2.1 何为数据挖掘 1.2.2 数据分析与建模的典型流程 1.2.3 交通数据类型介绍 1.3 本书的算例数据集简介 1.4 本书简介 1.5 参考文献 第2章 Python数据分析应用 2.1 Python环境配置 2.1.1 基础Python环境配置 2.1.2 Anaconda环境配置 2.1.3 常用交互式工具——Jupyter Notebook 2.2 Pvthon基础知识 2.2.1 基础数据类型 2.2.2 变量和赋值 2.2.3 缩进和注释 2.3 Python中的容器 2.3.1 列表 2.3.2 元组 2.3.3 字典 2.3.4 集合 2.4 流程控制语句 2.4.1 条件判断 2.4.2 循环 2.5 函数的定义与调用 2.6 异常处理 2.7 匿名函数 2.8 Python中的模块 2.8.1 模块的使用方法 2.8.2 Python标准库简介 2.8.3 Numpy简介 2.8.4 Pantlas简介 2.8.5 Matplotlib简介 2.8.6 Scikit-learn简介 2.8.7 Tensor-Flow简介 2.9 本章小结 2.10 本章习题 2.11 参考文献 第3章 数据预处理与探索性数据分析 3.1 数据预处理 3.1.1 数据质量分析 3.1.2 缺失值处理 3.1.3 异常值处理 3.1.4 数据标准化处理 3.2 时空数据分析基础 3.2.1 空间坐标系转换 3.2.2 时空单元划分 3.2.3 时空特征提取 3.2.4 网格化处理后的网约车轨迹数据 3.3 探索性数据分析 3.3.1 数据分布特征分析 3.3.2 统计量分析 3.3.3 对比分析 3.3.4 周期性分析 3.3.5 相关性分析 3.4 本章小结 3.5 本章习题 3.6 参考文献 第4章 大数据可视化的Python实践 第5章 机器学习简介 第6章 线性模型 第7章 支持向量机 第8章 决策树 第9章 聚类分析 第10章 集成学习 第11章 人工神经网络 第12章 深度学习 |