网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python数据分析从0到1/清华开发者书库
分类
作者
出版社 清华大学出版社
下载
简介
内容推荐
本书以Python作为数据分析的工具,系统地介绍数据分析所需的核心知识点,为书中的数据分析任务提供分析说明、代码示例和极为详细的代码注释,对于代码中出现的重要知识点会细心地为读者标注出相关内容在书中出现的章节位置。
全书共11章,分为3篇:初识篇、基础篇和进阶篇。初识篇(第1和2章),主要介绍数据分析和Python的相关基础概念,一些数据分析的具体应用场景及Python的集成开发环境;基础篇(第3~9章),主要介绍Python的基础语法,自动化办公的基础操作,数据可视化库Matplotlib和Seaborn,数据分析的核心库Numpy和Pandas,提供了大量翔实有趣的编程和数据分析示例;进阶篇(第10和11章),主要介绍了机器学习的入门基础理论知识和代码实现,监督学习和无监督学习的各种典型算法,涉及机器学习和数据挖掘的常用库scikit-learn及神经网络框架PyTorch等的使用,还介绍了编程算法中的动态规划,数据分析的实战例子。
本书面向初学者,可以作为高等院校各专业的数据分析课程教材,也可以作为广大数据分析从业者、爱好者、办公人员、科研人员的参考和学习用书。
目录
初识篇
第1章 Python与数据分析
1.1 数据分析概念
1.2 为什么使用Python
1.2.1 智能时代的通用语言
1.2.2 强大高效的第三方库
1.2.3 轻松的代码结合能力
1.3 数据分析领域的应用场景
1.3.1 医疗健康
1.3.2 交通出行
1.3.3 商业策略
1.3.4 经济金融
1.3.5 城乡规划
1.3.6 气象变化
1.3.7 科研及自动化办公
1.4 本章小结
第2章 初识Python
2.1 Python语言特点
2.2 Python安装方式
2.2.1 Anaconda安装
2.2.2 官网安装
2.3 Python集成开发环境
2.3.1 Jupyter Notebook
2.3.2 Spyder
2.3.3 PyCharm
2.4 本章小结
基础篇
第3章 Python基础
3.1 变量与赋值
3.1.1 变量
3.1.2 赋值
3.2 输入与输出
3.2.1 输入
3.2.2 输出
3.3 Python对象
3.3.1 Python对象的概念
3.3.2 变量与对象的关系
3.4 数据类型
3.4.1 数字
3.4.2 字符串
3.4.3 列表
3.4.4 元组
3.4.5 字典
3.4.6 集合
3.5 运算符与表达式
3.5.1 算术运算符
3.5.2 比较运算符
3.5.3 逻辑运算符
3.5.4 位运算符
3.5.5 赋值运算符
3.5.6 成员运算符
3.5.7 身份运算符
3.6 选择结构
3.6.1 if语句
3.6.2 ifelse语句
3.6.3 ifelifelse语句
3.7 循环结构
3.7.1 while循环
3.7.2 for循环
3.7.3 循环嵌套
3.7.4 循环控制语句
3.8 综合示例
3.9 本章小结
第4章 Python函数与模块
4.1 函数
4.1.1 函数的概念
4.1.2 函数的声明
4.1.3 函数的参数
4.1.4 函数的调用及参数值的传递过程
4.1.5 变量的作用域
4.1.6 lambda函数
4.1.7 函数编程示例
4.1.8 递归函数
4.2 第三方模块
4.2.1 概念与作用
4.2.2 第三方模块的导入与使用
4.3 本章小结
第5章 面向对象编程
5.1 面向对象
5.1.1 类和对象的概念
5.1.2 面向过程编程与面向对象编程比较
5.2 类、对象的创建和使用
5.2.1 类的定义及实例化
5.2.2 类变量和类方法的权限
5.2.3 综合示例
5.3 类的继承
5.3.1 继承的概念
5.3.2 继承的语法和使用
5.4 Python中的异常处理机制
5.4.1 异常的概念
5.4.2 异常处理语句
5.4.3 assert断言
5.4.4 自定义异常
5.5 本章小结
第6章 Python文件操作
6.1 文件字符的编码方式
6.2 Python文件的操作步骤
6.3 文件的打开与关闭
6.4 文件的读取与写入
6.5 Excel文件操作库简介
6.6 Python文件的批量自动化操作
6.7 本章小结
第7章 数据可视化
7.1 Matplotlib
7.1.1 Matplotlib简介及安装
7.1.2 Matplotlib绘图基础
7.1.3 默认属性值的修改与绘图填充
7.1.4 常用绘图形式
7.1.5 词云
7.2 Seaborn
7.2.1 折线图
7.2.2 散点图
7.2.3 关联图
7.2.4 直方图
7.2.5 其他常用绘图形式
7.2.6 绘图风格与数据分组
7.3 本章小结
第8章 数值计算扩展库
8.1 NumPy简介及安装
8.2 数组的创建
8.3 数组对象ndarray的常用属性
8.4 数组对象的数据取值
8.4.1 索引取值
8.4.2 索引列表取值
8.4.3 切片取值
8.4.4 布尔取值
8.4.5 搭配取值
8.4.6 迭代取值
8.5 数组对象元素的更新
8.6 数组对象的合并与拆分
8.7 数组对象的基本运算与广播机制
8.8 数组对象支持的数据类型
8.9 数组对象的维度转换
8.10 NumPy的随机数组
8.11 数组对象的常用数据统计函数
8.12 数据处理常用操作
8.13 数组对象的常用数学函数
8.14 NumPy与线性代数计算
8.15 NumPy文件和批量数据操作
8.16 本章小结
第9章 结构化数据分析库
9.1 Pandas简介及安装
9.2 Pandas支持的数据类型
9.3 Series对象详细讲解
9.3.1 Series对象的创建方法
9.3.2 Series对象的属性
9.3.3 Series对象的取值
9.3.4 Series对象的更新
9.3.5 Series对象的基本运算
9.3.6 Series对象的统计函数
9.3.7 Series对象的字符串处理
9.3.8 Series对象的常用函数
9.4 DataFrame对象详细讲解
9.4.1 DataFrame对象的创建方法
9.4.2 DataFrame对象的属性
9.4.3 DataFrame对象的取值
9.4.4 DataFrame对象的更新
9.4.5 DataFrame对象的基本运算
9.4.6 DataFrame对象的统计函数
9.4.7 DataFrame对象的字符串处理
9.4.8 DataFrame对象的常用函数
9.5 Pandas的文件操作
9.5.1 读取和写入Excel文
序言
前言
为什么要写本书随着信息技术和人工智能
产业的蓬勃发展,数据成为时代发展下的珍贵资
源。各行各业通过数据分析技术挖掘数据的价值
,数据分析技术在如医疗健康、交通出行、商业
策略、经济金融、城乡规划、气象变化、科学研
究及自动化办公等许多领域大放异彩,取得了巨
大的成功,因此无论是工业界还是学术界,对数
据分析人才的需求都十分迫切。本书选择
Python作为数据分析的利器。Python作为一门
简单易用的编程语言,又因其具有众多功能强大
的第三方库而被广泛应用于人工智能领域,许多
与人工智能关联的框架都是以Python作为主要
语言进行开发的。数据分析与人工智能等相关领
域密不可分,数据分析中可以应用相应的智能算
法辅助决策,人工智能也离不开对数据的分析与
处理,因此使用Python作为数据分析的工具能
很好地适应智能产业时代的发展,并且Python
与其他学科有很好的交融性、适应性。由于知识
更新迭代的速度日新月异,本书编写的目的不仅
仅是希望读者掌握本书介绍的Python数据分析
知识,更希望读者能够掌握学习数据分析的技巧
,重视编程能力提升,让读者在掌握本书知识内
容的情况下,无论是继续学习数据分析相关知识
,还是想拓展涉及更多更深的Python应用领域(
如人工智能、机器学习方向),都能够有扎实的
基础。本书内容与特色全书共分为3篇: 初识篇
、基础篇和进阶篇。初识篇(第1章和第2章),
主要介绍数据分析和Python的相关基础概念,
一些数据分析的具体应用场景及Python的集成
开发环境; 基础篇(第3~9章),主要介绍
Python的基础语法,自动化办公的基础操作,
借助Matplotlib和Seaborn进行数据可视化,数
据分析的核心库NumPy和Pandas,提供了大量翔
实、有趣的编程和数据分析示例; 进阶篇(第
10章和第11章),主要介绍机器学习的入门基础
理论知识和代码实现,监督学习和无监督学习的
各种典型算法,涉及机器学习和数据挖掘的常用
库scikitlearn及神经网络框架PyTorch等的
使用,还介绍了编程算法中的动态规划,以及数
据分析的实战例子。由于不同的读者对Python
代码的接受程度不一样,知识基础也不一样,因
此为了让读者尽可能轻松地理解全书内容,没有
专业障碍地进行全书内容学习,编者尽量站在读
者的角度进行全书的写作。本书以通俗语言为读
者进行内容的阐释,对于书中所举的数据分析任
务提供分析说明和示例代码,在代码中也有着极
为详细的注释,如果书中后面内容的代码使用了
前面内容介绍的知识,还会细心地为读者标注相
关内容在书中出现的具体位置,以期减轻读者的
代码阅读负担,提高读者的学习效率,节省读者
的时间。读者对象本书面向的读者是数据分析的
初学者,可以作为高等院校各专业的“数据分析
”课程教材,也可以作为广大数据分析从业者、
爱好者、办公人员、科研人员的参考和学习用书
。勘误和支持由于编者的水平及撰稿时间有限,
书中难免会出现一些疏漏或者表意不准确的地方
,诚挚恳请读者及专家、学者给予批评和指正。
致谢特别感谢清华大学出版社的赵佳霓老师,感
谢她对本书专业且高效的审阅,以及对书中各种
表意方式和文笔的润色建议。感谢参与本书出版
的所有出版社的老师,在他们的辛勤努力下,才
有了本书的顺利出版。
感谢厦门大学智能多媒体技术实验室和厦
门大学数据挖掘与计算智能实验室的所有老师和
同学,感谢他们在本书编写过程中给予的支持、
指导和帮助,以及对编者的理解和鼓励。最后,
感谢编者的家人和朋友的一路陪伴,编者将始终
满怀感恩!配套资源为了方便读者学习,本书配
套提供了书中的程序代码,并录制了部分重点内
容的讲解视频,读者扫描下方二维码即可下载代
码及相关数据文件。
本书源代码
撰写一本书是为了将知识和技能进行梳理
并分享给大众,为大众提供便利是一件非常有意
义的事情。最后,编者希望本书能够为数据分析
技术的普及贡献绵薄之力。编者2021年9月于厦
导语
本书系统、全面讲解Python数据分析知识,帮助读者掌握学习数据分析的技巧,提升编程能力,让读者在掌握本书知识内容的情况下,无论是继续学习数据分析相关知识,还是想拓展涉及更多更深的Python应用领域(如人工智能、机器学习方向),都能够有扎实的基础。
精彩页
第3章
Python基础
本章将正式为读者介绍Python代码相关的基础知识,为了让读者能够快速入门并且熟练地编写Python代码,本章将用大量生活中常见的例子帮助读者理解抽象的基础理论,运用类比、举例的方式让读者轻松掌握代码的使用技巧。全书的示例代码及代码注释翔实,能够一步步引领读者实践理论并带领读者深入思考。本章各节内容的知识点联系紧密,环环相扣,为读者梳理出全面且清晰的知识脉络。当然,学习编程的最核心方法是勤加动手练习,因此在3.8节将提供高质量的综合示例供读者阅读、巩固、思考和提升。
7min
3.1变量与赋值
3.1.1变量
1. 变量的概念
相信读者在学习数学的过程中对“变量”一词并不陌生,如函数式(31)中的x便是数学中我们熟知的变量,x(变量)可以发生改变,可以指定取值范围,如规定函数式(31)中的x只能取1,则变量的取值可以表示为x=1,换个思维理解,x=1意味着变量x可以像容器一样保存1。计算机语言借鉴了这种思维,计算机语言中的变量正像一个容器,创建一个变量的同时会在计算机内存中开辟出一个相应的存储空间,这个空间不仅能存储数字类型的数据,还能存储字符串等非数字类型的数据。
f(x)=x2+2x+1
(31)
式中: x为函数中的自变量。
因此计算机语言中的变量能存储的数据值可以有多种类型,Python中的数据类型分为数字、字符串、列表、元组、字典和集合,Python数据类型的具体内容将在3.4节详细介绍。
2. 变量的命名规则及Python关键字
1) 变量的命名规则
计算机语言可以根据人们的需求创建多个能够存储不同类型数据的变量,为了能够对这些变量加以区分和使用,必须为每个变量按照一定的规则命名,Python变量的命名规则如表31所示。
2) Python关键字
Python关键字是指已经被Python语言本身使用过的字符名称,这些字符名称在Python中具有特定的功能,因此不能被重复使用,就像在某个系统中已经注册过的名称,用户不能再重复注册和使用该名称。Python中的关键字如表32所示。
表31Python变量的命名规则
序号命 名 规 则
1
变量名由数字、字母、下画线的任意组合构成
2
不能以数字作为变量名的开头,不能包含空格
3
变量名区分大小写,如变量名Matrix与变量名matrix不代表同一变量
4
不能将变量名命名为Python关键字
表32Python关键字
and
as
assert
break
class
continue
def
del
else
elif
except
finally
for
from
False
global
if
in
is
import
lambda
not
nonlocal
None
or
pass
raise
return
True
try
while
with
yield
3.1.2赋值
1. 赋值符号1,同时为对象1分配内存空间,变量a是对象1的引用
print(id(1)) \t#id(1)指的是对象1的地址特征
print(id(a))\t#id(a)指的是变量a所引用对象1的地址特征
print(type(1))\t#type(1)指的是对象1的类型特征
print(type(a))\t#type(a)指的是变量a所引用对象1的类型特征
print(a)\t#输出a所引用对象的值
输出: 140712965153168
140712965153168


1
上述代码中,id(1)与id(a)的结果相同,均为140712965153168,说明变量a引用了对象1的地址,两者绑定在一起,type(1)与type(a)的结果相同,均为,说明变量a引用了对象1的类型。
打个比方,在每家每户的户口簿信息上,有个人的户籍地址信息(对应对象中的地址特征)、与户主的关系信息(对应对象中的类型特征)、个人姓名(对应对象中的值特征),户籍管理系统(对应对象中的变量)能通过个人的户籍地址信息(对象中的地址特征)查询访问住户个人姓名(对象中的值特征)进而实现对户籍信息的管理。
总之,对象是分配的内存块,变量是对象的引用或者说变量指向对象,通过变量可以操作对象所代表的内存块。
注意:
对象包含属性和方法(函数),上述内容只介绍了对象的3个特征(地址、类型、值)和对象与变量之间的关系,但在实际编程中我们会频繁地使用数据类型对象中的属性和方法(函数),以列表类型对象为例,我们可以利用“对象名.属性”“对象名.函数”的语法方式调用列表对象中的方法,如a是一个列表类型对象,可以利用a.append(3)调用列表中的append()方法在列表a的末尾添加3这个元素,append()函数的具体内容详见3.4节。
3.4数据类型
Python将数字、字符串、元组划分为不可变数据类型对象,将列表、字典、集合划分为可变数据类型对象,详细说明如表33所示。
表33可变与不可变数据类型对象详细说明
序号
数据类型 划 分 类 别
详 细 说 明
1
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/15 12:59:05