本书详细阐述了与SQL数据分析相关的基本解决方案,主要包括SQL数据分析导论、SQL和数据准备、聚合和窗口函数、导入和导出数据、使用复合数据类型进行分析、高性能SQL、科学方法和应用问题求解等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | SQL数据分析实战(第2版) |
分类 | |
作者 | (美)马特·古德瓦瑟 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 内容推荐 本书详细阐述了与SQL数据分析相关的基本解决方案,主要包括SQL数据分析导论、SQL和数据准备、聚合和窗口函数、导入和导出数据、使用复合数据类型进行分析、高性能SQL、科学方法和应用问题求解等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。 目录 第1章 SQL数据分析导论 1.1 本章主题简介 1.2 数据世界 1.2.1 数据类型 1.2.2 数据分析和统计 1.2.3 统计类型 1.2.4 作业1.01:分类新数据集 1.3 描述性统计方法 1.3.1 单变量分析 1.3.2 数据频率分布 1.3.3 练习1.01:创建直方图 1.3.4 分位数 1.3.5 练习1.02:计算附加销售额的四分位数 1.3.6 集中趋势的度量 1.3.7 练习1.03:计算附加销售额的集中趋势 1.3.8 数据散布的度量 1.3.9 练习1.04:附加销售额的散布程度 1.3.10 双变量分析 1.3.11 散点图 1.3.12 皮尔逊相关系数 1.3.13 练习1.05:计算两个变量的Pearson相关系数 1.3.14 解释和分析相关系数 1.3.15 时间序列数据 1.3.16 作业1.02:探索经销商销售数据 1.3.17 处理缺失数据 1.4 统计显著性检验 1.4.1 统计显著性检验的组成 1.4.2 常见的统计显著性检验 1.5 关系数据库和SQL 1.5.1 关系数据库的基础概念 1.5.2 SQL数据库的优缺点 1.6 SQL的基本数据类型 1.6.1 数值 1.6.2 字符 1.6.3 布尔值 1.6.4 日期时间值 1.6.5 数据结构:JSON和数组 1.7 读取表:SELECT查询 1.7.1 SELECT查询的工作原理 1.7.2 SELECT查询中的基本关键字 1.7.3 SELECT和FROM语句 1.7.4 WHERE子句 1.7.5 AND/OR子句 1.7.6 IN/NOTIN子句 1.7.7 ORDERBY子句 1.7.8 LIMIT子句 1.7.9 ISNULL/ISNOTNULL子句 1.7.10 练习1.06:在SELECT查询中使用基本关键字 1.7.11 作业1.03:在SELECT查询中使用基本关键字查询客户表 1.8 创建表 1.8.1 创建空白表 1.8.2 列约束 1.8.3 练习1.07:在SQL中创建表 1.8.4 使用SELECT创建表 1.9 更新表 1.9.1 添加和删除列 1.9.2 添加新数据 1.9.3 更新现有行 1.9.4 练习1.08:更新表格以提高车辆的价格 1.10 删除数据和表 1.10.1 从行中删除值 1.10.2 从表中删除行 1.10.3 删除表 1.10.4 练习1.09:删除不必要的表 1.10.5 作业1.04:为营销活动创建和修改表 1.11 SQL和分析 1.12 小结 第2章 SQL和数据准备 2.1 本章主题简介 2.2 组合数据 2.2.1 使用JOIN连接表 2.2.2 连接类型 2.2.3 内连接 2.2.4 外连接 2.2.5 交叉连接 2.2.6 练习2.01:使用JOIN进行分析 2.2.7 子查询 2.2.8 UNION 2.2.9 练习2.02:使用UNION生成来宾名单 2.2.10 公用表表达式 2.3 转换数据 2.3.1 CASE WHEN函数 2.3.2 练习2.03:使用CASE WHEN函数获取区域列表 2.3.3 COALESCE函数 2.3.4 NULLIF函数 2.3.5 LEAST和GREATEST函数 2.3.6 转换函数 2.3.7 DISTINCT和DISTINCT ON函数 2.3.8 作业2.01:使用SQL技术构建销售模型 2.4 小结 第3章 聚合和窗口函数 3.1 本章主题简介 3.2 聚合函数 3.2.1 常见聚合函数简介 3.2.2 练习3.01:使用聚合函数分析数据 3.3 使用GROUPBY聚合函数 3.3.1 GROUPBY子句 3.3.2 多列GROUPBY 3.3.3 练习3.02:使用GROUPBY按产品类型计算成本 3.3.4 分组集 3.3.5 有序集合聚合 3.4 HAVING子句 3.4.1 HAVING子句的语法 3.4.2 练习3.03:使用HAVING子句计算并显示数据 3.5 使用聚合函数清洗数据和检查数据质量 3.5.1 使用GROUPBY查找缺失值 3.5.2 使用聚合函数衡量数据质量 3.5.3 作业3.01:使用聚合函数分析销售数据 3.6 窗口函数 3.6.1 窗口函数基础知识 3.6.2 练习3.04:分析一段时间内的客户数据填充率 3.6.3 WINDOW关键字 3.7 窗口函数统计 3.7.1 练习3.05:雇佣日期的排名顺序 3.7.2 窗口frame子句 3.7.3 练习3.06:团队午餐激励 3.7.4 作业3.02:使用窗口帧和窗口函数分析销售数据 3.8 小结 第4章 导入和导出数据 4.1 本章主题简介 4.2 COPY命令 4.2.1 使用psql复制数据 4.2.2 配置COPY和\\copy 4.2.3 使用COPY和\\copy将数据批量上传到数据库 4.2.4 练习4.01:将数据导出到文件以在Excel中进一步处理 4.3 使用R分析数据 4.3.1 使用R的原因 4.3.2 开始使用R 4.4 使用Python分析数据 4.4.1 使用Python的原因 4.4.2 开始使用Python 4.4.3 使用SQLAlchemy和Pandas改进Python中的Postgres访问 4.4.4 关于SQLAlchemy 4.4.5 结合使用Python和JupyterNotebook 4.4.6 使用Pandas读写数据库 4.4.7 练习4.02:在Python中读取和可视化数据 4.4.8 使用Python将 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。