内容推荐 采用机器学习方法和Python,可以使丰富的认知得以自动呈现。本书使用基于案例解析的实践方法来解决实际应用中运用机器学习的难题。这些更智能的机器将使你的业务流程以最短的时间和最少的资源实现高效率。 达西·哈龙著的《Python机器学习5个数据科学家案例解析》将指导你完成改进业务流程的步骤,并确定框架策略的关键点。你将了解可用于支持产品和服务的机器学习技术。此外,还将了解每个机器学习概念的优缺点,以帮助确定哪一种最适合需求。 通过逐步采用Python编程的方法,你将能够理解机器学习过程中模型选择和决策背后的基本原理。本书提供实用的示例和代码,以确保你理解解决实际问题的数据科学方法。 目录 第1章 统计与概率 1.1 案例研究:自行车共享计划——确定品牌角色 1.2 进行探索性数据分析 1.2.1 特征探索 1.2.2 变量的类型 1.2.3 单变量分析 1.2.4 多变量分析 1.2.5 时间序列成分 1.3 度量测度中心 1.3.1 平均数 1.3.2 中位数 1.3.3 众数 1.3.4 方差 1.3.5 标准差 1.3.6 由于常量的存在而导致中心统计度量的变化 1.3.7 正态分布 1.4 相关性 1.4.1 Pearson R相关 1.4.2 Kendall秩相关 1.4.3 Spearman秩相关 1.5 假设检验:比较两组 1.5.1 t-统计量 1.5.2 t-分布和样本容量 1.6 中心极限定理 1.7 案例研究发现 1.8 统计和概率的应用 1.8.1 精算科学 1.8.2 生物统计学 1.8.3 天文统计学 1.8.4 商业分析 1.8.5 计量经济学 1.8.6 机器学习 1.8.7 统计信号处理 1.8.8 选举 第2章 回归 2.1 案例研究:消除混凝土抗压强度的不一致性 2.2 回归的概念 2.2.1 内插和外推 2.2.2 线性回归 2.2.3 y在x上的最小二乘回归线 2.2.4 多重回归 2.2.5 逐步回归 2.2.6 多项式回归 2.3 回归的假设 2.3.1 案例数量 2.3.2 缺失数据 2.3.3 多重共线性与奇异性 2.4 特征探索 2.5 过拟合和欠拟合 2.6 回归度量的评估 2.6.1 解释方差得分 2.6.2 平均绝对误差 2.6.3 均方误差 2.6.4 R2 2.6.5 残差 2.6.6 残差图 2.6.7 残差平方和 2.7 回归的类型 2.7.1 线性回归 2.7.2 网格搜索 2.7.3 岭回归 2.7.4 套索回归 2.7.5 ElasticNet 2.7.6 梯度boosting回归 2.7.7 支持向量机 2.8 回归的应用 2.8.1 预测销售额 2.8.2 预测债券价值 2.8.3 通货膨胀率 2.8.4 保险公司 2.8.5 呼叫中心 2.8.6 农业 2.8.7 预测薪水 2.8.8 房地产行业 第3章 时间序列 3.1 案例研究:预测雅虎的每日调整的收盘价 3.2 特征探索 3.3 评估时间序列对象的平稳性 3.3.1 具有平稳本质的时间序列的性质 3.3.2 测试以确定时间序列是否平稳 3.3.3 制作时间序列对象的方法 3.4 测试以确定时间序列是否具有自相关性 3.4.1 自相关函数 3.4.2 偏自相关函数 3.4.3 度量自相关 3.4.4 Durbin Watson统计 3.5 建模时间序列 3.5.1 验证预测序列的实验 3.5.2 确定建模参数 3.6 白回归综合移动平均 3.6.1 自回归移动平均 3.6.2 自回归 3.6.3 移动平均线 3.6.4 组合模型 3.7 缩减预测规模 3.8 时间序列分析应用 3.8.1 销售预测 3.8.2 天气预测 3.8.3 失业率估计 3.8.4 疾病爆发 3.8.5 股市预测 第4章 聚类 4.1 案例研究:确定营销短尾关键词 4.2 特征的探索 4.3 有监督学习与无监督学习 4.3.1 有监督学习 4.3.2 无监督学习 4.4 聚类分析 4.5 为建模作数据转换 4.6 聚类模型 4.6.1 k-means聚类 4.6.2 将k-means聚类应用于簇的最优数量 4.6.3 主成分分析 4.6.4 高斯混合模型 4.6.5 贝叶斯高斯混合模型 4.7 聚类的应用 4.7.1 疾病识别 4.7.2 搜索引擎中的文档聚类 4.7.3 基于人口统计的客户划分 第5章 分类 5.1 案例研究:俄亥俄州诊所——满足供求 5.2 特征探究 5.3 实施数据整理 5.4 实施探索性数据分析 5.5 特征的生成 5.6 分类 5.6.1 模型评估技术 5.6.2 二元分类器:受试者工作特征 5.6.3 决策树分类 5.7 核近似 5.7.1 SGD分类器 5.7.2 集成方法 5.8 随机森林分类 5.9 分类应用 5.9.1 图像分类 5.9.2 音乐分类 5.9.3 E-mail的垃圾邮件过滤 5.9.4 保险 附录A 图表类型以及何时使用它们
|