网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 SQL机器学习库MADlib技术解析
分类
作者 王雪迎
出版社 清华大学出版社
下载
简介
作者简介
王雪迎,毕业于中国地质大学计算机专业,高级工程师,拥有20年数据库、数据仓库相关技术经验。曾先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。
目录
第1章 MADlib基础
1.1 基本概念
1.1.1 MADlib是什么
1.1.2 MADlib的设计思想
1.1.3 MADlib的工作原理
1.1.4 MADlib的执行流程
1.1.5 MADlib架构
1.2 MADlib的功能
1.2.1 MADlib支持的模型类型
1.2.2 MADlib的主要功能模块
1.3 MADlib的安装与卸载
1.3.1 确定安装平台
1.3.2 下载MADlib二进制压缩包
1.3.3 安装MADlib
1.3.4 卸载MADlib
1.4 小结
第2章 数据类型
2.1 向量
2.1.1 MADlib中的向量操作函数
2.1.2 稀疏向量
2.2 矩阵
2.2.1 矩阵定义
2.2.2 MADlib中的矩阵表示
2.2.3 MADlib中的矩阵运算函数
2.3 小结
第3章 数据转换
3.1 邻近度
3.1.1 MADlib的邻近度相关函数
3.1.2 距离度量的中心化和标准化
3.1.3 选取正确的邻近度度量
3.2 矩阵分解
3.2.1 低秩矩阵分解
3.2.2 奇异值分解
3.3 透视表
3.4 分类变量编码
3.5 小结
第4章 数据探索
4.1 描述性统计
4.1.1 皮尔森相关
4.1.2 汇总统计
4.2 概率统计
4.2.1 概率
4.2.2 统计推论
4.3 主成分分析
4.3.1 背景知识
4.3.2 MADlib的PCA相关函数
4.3.3 MADlib的PCA应用示例
4.4 小结
第5章 回归
5.1 线性回归 5.1.1 背景知识
5.1.2 MADlib的线性回归相关函数
5.1.3 线性回归示例
5.2 非线性回归
5.2.1 背景知识
5.2.2 MADlib的非线性回归相关函数
5.2.3 非线性回归示例
5.3 逻辑回归
5.3.1 背景知识
5.3.2 MADlib的逻辑回归相关函数
5.3.3 逻辑回归示例
5.4 多类回归
5.4.1 背景知识
5.4.2 MADlib的多类回归相关函数
5.4.3 多类回归示例
5.5 序数回归
5.5.1 背景知识
5.5.2 MADlib的序数回归相关函数
5.5.3 序数回归示例
5.6 弹性网络回归
5.6.1 背景知识
5.6.2 MADlib的弹性网络回归相关函数
5.6.3 弹性网络回归示例
5.7 小结
第6章 时间序列分析
6.1 背景知识
6.1.1 时间序列分析方法
6.1.2 ARIMA模型
6.2 MADlib中ARIMA相关函数
6.3 时间序列分析示例
6.4 小结
第7章 分类
7.1 K近邻
7.1.1 背景知识
7.1.2 MADlib中K近邻函数
7.1.3 K近邻示例
7.2 朴素贝叶斯
7.2.1 背景知识
7.2.2 MADlib中朴素贝叶斯分类相关函数
7.2.3 朴素贝叶斯分类示例
7.3 支持向量机
7.3.1 背景知识
7.3.2 MADlib的支持向量机相关函数
7.3.3 支持向量机示例
7.4 决策树
7.4.1 背景知识
7.4.2 MADlib的决策树相关函数
7.4.3 决策树示例
7.5 随机森林
7.5.1 背景知识 7.5.2 MADlib的随机森林相关函数
7.5.3 随机森林示例
7.6 小结
第8章 聚类
8.1 背景知识
8.1.1 聚类的概念
8.1.2 k-means方法
8.2 MADlib的k-means相关函数
8.2.1 训练函数
8.2.2 簇分配函数
8.2.3 轮廓系数函数
8.3 k-means示例
8.4 小结
第9章 关联规则
9.1 背景知识
9.1.1 基本概念
9.1.2 Apriori算法
9.2 MADlib的Apriori算法函数
9.3 Apriori应用示例
9.4 小结
第10章 图算法
10.1 背景知识
10.1.1 基本概念
10.1.2 常见图算法
10.1.3 单源最短路径
10.2 MADlib的单源最短路径相关函数
10.3 单源最短路径示例
10.4 小结
第11章 模型评估
11.1 交叉验证
11.1.1 背景知识
11.1.2 MADlib的交叉验证相关函数
11.1.3 交叉验证示例
11.2 预测度量
11.3 小结
内容推荐
MADlib是一套SQL中的大数据机器学习库。通常SQL查询能发现数据最明显的模式和趋势,但要想获取数据中最为有用的信息,需要的则是一套牢固扎根于数学和应用数学的技能,这就是机器学习。如果将SQL的简单易用与MADlib机器学习的复杂算法结合起来,就能实现简单的机器学习功能。
王雪迎著的《SQL机器学习库MADlib技术解析》分为11章,从MADlib的基本概念、MADlib的架构、支持的模型类型与功能入手,详细解析MADlib各种模型的具体用法,包括数据类型、矩阵分解、数据转换、数据探索、主成分分析、回归、时间序列分析、分类、聚类、关联规则、图算法、模型评估等。每种模型将从背景知识、函数语法、应用示例三方面进行说明。
本书适合MADlib机器学习的初学者、想学习MADlib机器学习的DBA以及从事数据分析与挖掘的高级技术人员阅读,也适合高等院校与培训学校相关专业的师生教学参考。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/23 2:17:34