译者序
作者简介
技术审核员简介
致谢
第1章 简介
1.1 为何选择Python
1.2 何时避免使用Python
1.3 Python中的面向对象编程
1.4 在Python中调用其他语言
1.5 将Python模型作为微服务
1.6 高性能API和并发编程
第2章 Python结构化数据提取、转换和加载
2.1 MySQL
2.1.1 如何安装MySQLdb
2.1.2 数据库连接
2.1.3 INSERT操作
2.1.4 READ操作
2.1.5 DELETE操作
2.1.6 UPDATE操作
2.1.7 COMMIT操作
2.1.8 ROLL-BACK操作
2.2 Elasticsearch
2.3 Neo4j Python驱动
2.4 neo4j-rest-client
2.5 内存数据库
2.6 Python版本MongoDB
2.6.1 将数据导入集合
2.6.2 使用pymongo创建连接
2.6.3 访问数据库对象
2.6.4 插入数据
2.6.5 更新数据
2.6.6 删除数据
2.7 Pandas
2.8 Python非结构化数据提取、转换和加载
2.8.1 电子邮件解析
2.8.2 主题爬取
第3章 基于Python的监督学习
3.1 使用Python实现降维
3.1.1 相关性分析
3.1.2 主成分分析
3.1.3 互信息
3.2 使用Python进行分类
3.3 半监督学习
3.4 决策树
3.4.1 哪个属性优先
3.4.2 随机森林分类器
3.5 朴素贝叶斯分类器
3.6 支持向量机
3.7 最近邻分类器
3.8 情绪分析 3.9 图像识别
3.10 使用Python进行回归
3.10.1 最小二乘估计
3.10.2 逻辑回归
3.11 分类和回归
3.12 使模型高估或低估
3.13 处理分类型数据
第4章 无监督学习—聚类
4.1 K均值聚类
4.2 选择K—肘部法则
4.3 距离或相似性度量
4.3.1 属性
4.3.2 一般及欧氏距离
4.3.3 平方欧氏距离
4.3.4 字符串之间的编辑距离
4.4 文档上下文的相似性
4.5 什么是层次聚类
4.5.1 自下而上的方法
4.5.2 聚类之间的距离
4.5.3 自上而下的方法
4.5.4 图论方法
4.6 如何判断聚类结果是否良好
第5章 深度学习和神经网络
5.1 反向传播
5.1.1 反向传播方法
5.1.2 广义Delta规则
5.1.3 输出层权重更新
5.1.4 隐藏层权重更新
5.1.5 反向传播网络小结
5.2 反向传播算法
5.3 其他算法
5.4 TensorFlow
5.5 递归神经网络
第6章 时间序列
6.1 变化的分类
6.2 包含趋势的序列分析
6.2.1 曲线拟合
6.2.2 从时间序列中去除趋势
6.3 包含周期性的序列数据分析
6.4 从时间序列中去除周期性
6.4.1 滤波
6.4.2 差分
6.5 转换
6.5.1 稳定方差
6.5.2 使周期效应累加
6.5.3 使数据呈正态分布
6.6 平稳时间序列
6.6.1 平稳过程
6.6.2 自相关和相关图
6.6.3 自协方差和自相关函数的估计 6.7 使用Python进行时间序列分析
6.7.1 有用的方法
6.7.2 自回归过程
6.7.3 估计AR过程的参数
6.8 混合ARMA模型
6.9 集成ARMA模型
6.10 傅里叶变换
6.11 一个特殊的场景
6.12 数据缺失
第7章 大数据分析
7.1 Hadoop
7.1.1 MapReduce编程
7.1.2 partitioning函数
7.1.3 combiner函数
7.1.4 HDFS文件系统
7.1.5 MapReduce设计模式
7.2 Spark
7.3 云分析
7.4 物联网