![]()
内容推荐 Python是一种面向对象的脚本语言,广泛应用于Web开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。本书是作者长期应用Python进行机器学习开发实践的经验结晶,主要内容包括Python数据读取的技巧,数据探索性分析,数据预处理,特征选择,特征选择的常用技巧,算法模型,sklearn类库,Python中数据可视化的常用方法等。本书具有针对性、系统性、实操性强,原创度高的特点,读者对代码进行简单修改,就可以直接拿来使用。 本书适合于具有一定Python基础,且有志于从事机器学习、人工智能开发的读者使用。 目录 1 数据读取 1.1 数据读取常见问题 1.2 核心代码 1.2.1 读取Excel、csv、txt、json数据 1.2.2 读取docx文件和查询关键词 1.2.3 读取日志、图像、声音、视频 1.2.4 Oracle、MySQL数据读取 1.2.5 读取Hive数据 1.2.6 数据导出到本地 2 数据探索性分析 2.1 数据查看 2.2 数据统计 2.3 数据分组分析 2.4 相关性分析 2.5 典型案例 3 数据预处理 3.1 注意问题 3.2 核心代码 3.2.1 缺失值检测和处理 3.2.2 异常值检测和处理 3.2.3 数据标准化规范化正则化 3.2.4 数据平滑处理 3.2.5 样本类别分布不均衡处理 3.2.6 数据降维 3.2.7 训练集验证集切分 3.3 典型案例 3.3.1 原理 3.3.2 代码 4 特征选择 4.1 过滤式特征提取 4.2 递归特征消除 4.3 嵌入式特征提取 4.4 典型案例 5 算法建模 5.1 主流数据挖掘算法 5.1.1 有监督学习 5.1.2 无监督学习 5.2 自动化调参 5.2.1 暴力搜索寻优 5.2.2 随机搜索寻优 5.3 组合分类模型器 5.3.1 原理 5.3.2 函数及代码 5.4 典型案例 5.4.1 人脸识别 5.4.2 多方程模型预测 6 可视化 6.1 基本图形 6.1.1 折线图 6.1.2 面积图 6.1.3 柱形图 6.1.4 散点图 6.1.5 饼图 6.2 分析图形 6.2.1 词云图 6.2.2 相似度热力图 6.2.3 箱式分布图 6.2.4 对应分析图 |