![]()
内容推荐 本书涵盖了Python在数值计算和数据处理领域的常用扩展库,如NumPy、SciPy、Pandas、Matplotlib等,以数据载入、数据清洗与规整、数据分析与可视化为主线,利用浅显易懂的语言、丰富有趣的实例和案例,全面、系统地介绍了科学计算、数据处理与分析的知识。 本书共7章,第1章主要介绍Python语言以及环境的搭建和使用;第2~3章介绍Numpy和Pandas扩展库的数据结构和常用函数;第4章主要介绍了Pandas数据处理的相关技术;第5章主要介绍了Matplotlib和pandas两种数据可视化技术。第6章通过两个具体的案例介绍数据处理、数据探索的流程和方法;第7章介绍了数值计算扩展库Scipy中的拟合和优化、插值、线性代数、数值积分模块。 目录 第1章 Python简介与环境安装 1.1 Python简介 1.1.1 为什么使用Python 1.1.2 Python2和Python 1.2 Python环境安装 1.2.1 Anacanda安装 1.2.2 安装及更新Python包 1.3 IPython的使用 1.3.1 Python解释器 1.3.2 IPython是什么 1.3.3 安装IPython 1.3.4 IPython的使用 1.3.5 IPython的调试 1.4 JupyterNotebook 1.4.1 JupyterNotebook是什么 1.4.2 JupyterNotebook的使用 习题 第2章 NumPy基础 2.1 Python与数组的关系 2.2 N维数组对象ndarray 2.2.1 数组基本操作 2.2.2 数组生成函数 2.2.3 数组存取 2.2.4 结构体数组 2.2.5 数组高级操作 2.3 通用函数 2.3.1 算术运算 2.3.2 比较运算 2.3.3 逻辑运算 2.4 聚合函数 2.5 排序函数 2.5.1 np.sort 2.5.2 ndarray.sort 2.5.3 np.argsort 2.5.4 np.lexsort 2.5.5 np.searchsorted 2.6 随机数生成函数 2.6.1 np.random.uniform 2.6.2 np.random.rand 2.6.3 np.random.randint 2.6.4 np.random.normal 2.6.5 np.random.choice 2.6.6 np.random.shuffle 2.6.7 np.random.permutation 2.7 NumPy广播 习题 第3章 Pandas基础 3.1 Pandas数据结构 3.1.1 Series 3.1.2 DataFrame 3.2 索引对象 3.2.1 索引对象Index 3.2.2 层次化索引对象MultiIndex 3.3 数据存取 3.3.1 属性和字典存取 3.3.2 []存取 3.3.3 loc和iloc存取 3.3.4 多级索引的存取 3.3.5 条件存取 3.4 Pandas字符串操作 3.4.1 字符串对象方法 3.4.2 正则表达式 3.4.3 Pandas中的向量化字符串函数 3.5 文件读写 3.5.1 CSV文件读写 3.5.2 Excel文件读写 3.5.3 HDF5文件读写 3.6 基本运算 3.6.1 算术运算 3.6.2 排序和排名 3.6.3 汇总和统计 习题 第4章 Pandas数据处理 4.1 数据清洗 4.1.1 处理缺失值 4.1.2 删除重复数据 4.1.3 删除列 4.1.4 重命名索引 4.2 数据规整 4.2.1 离散化和分箱 4.2.2 索引重塑和轴向旋转 4.2.3 分类 导语 一本介绍Python用于科学计算、数据处理与数据分析的产学合作的教材。 |