![]()
内容推荐 本书针对Python零基础的读者,重点讲解利用Python进行数据分析的基础知识,并通过大量的实战案例,使读者掌握数据处理、分析与可视化的方法。全书分为4个部分,共13章,主要内容包括:Python语法基础、网络爬虫、NumPy、pandas、正则表达式与格式化输出、数据处理与数据分析、Matplotlib、pyecharts、Altair动态可视化、NetworkX、航班数据分析、豆瓣网络数据分析、《红楼梦》文本数据分析等。 本书内容丰富、由浅入深,案例浅显易懂,适合作为普通高等院校数据科学与大数据技术、统计与大数据等专业相关课程的教材,也适合作为从事数据分析与可视化相关工作的从业人员的的参考书。 作者简介 余本国,博士,硕士研究生导师,主讲线性代数、微积分、Python语言、大数据分析基础等课程。2012年到加拿大York University做访问学者。出版有《Python数据分析基础》等多本著作,广受市场好评。 目录 第 一部分 Python语法基础\t5 第 1章 Python语法基础\t6 1.1 编辑器Anaconda\t6 1.2 语法规范\t12 1.3 程序结构\t18 1.4 异常值处理\t24 1.5 数据类型\t27 1.6 函数\t41 1.7 实战体验:超市小票打印功能\t46 第二部分 Python数据处理与分析\t48 第 2章 网络爬虫\t49 2.1 urllib库\t49 2.2 BeautifulSoup库\t51 2.3 scrapy框架爬虫\t55 2.4 实战体验:爬取豆瓣网数据\t61 第3章 Numpy\t67 3.1 数组的创建\t68 3.2 数组的操作\t74 3.3 数组的计算\t85 3.4 统计基础\t86 3.5 矩阵运算\t89 3.6 实战体验:图片翻转裁剪压缩处理\t92 第4章 Pandas\t96 4.1 Series\t96 4.2 DataFrame\t101 4.3 数据导入\t107 4.4 数据导出\t111 4.5 实战体验:输出符合条件的属性内容\t113 第5章 正则表达式与格式化输出\t116 5.1 正则表达式基础\t116 5.2 re模块\t118 5.3 贪婪匹配\t120 5.4 编译\t121 5.5 正则函数\t121 5.6 格式化输出\t126 5.7 实战体验:验证信息的正则表达式\t131 第6章 数据处理与分析\t134 6.1 数据处理\t134 6.2 数据标准化\t172 6.3 数据分析\t175 6.4 实战体验:股票统计分析\t185 第三部分 Python数据可视化\t192 第7章 Matplotlib\t193 7.1 Matplotlib的设置\t193 7.2 符号及中文标注处理\t194 7.3 绘图种类\t195 7.4 实战体验:南丁格尔玫瑰图\t206 第8章 Pyechartcs\t208 8.1 安装及配置\t208 8.2基本图表\t211 8.3 坐标系图表\t219 8.4 地图与地理坐标绘制\t224 8.5 3D图形\t228 第9章 Altair动态可视化\t230 9.1安装与导入Altair\t230 9.2 Altair图形语法\t231 9.3交互效果的实现\t236 9.4 实战体验:学生数据交互可视化\t241 第 10章 Networkx\t251 10.1 模块安装\t251 10.2 无向图\t251 10.3 有向图\t253 10.4 实战体验:标注货物流向图\t254 第四部分 应用案例\t256 第 11章 航班数据分析\t257 11.1 需求介绍\t257 11.2 预备知识\t257 11.3 航班数据处理\t260 11.4 完整代码\t266 第 12章 豆瓣网络数据分析\t269 12.1 数据处理\t269 12.2 计算平均星级\t270 12.3 计算均价\t272 第 13章 《红楼梦》文本数据分析\t277 13.1 准备工作\t277 13.2 分词\t278 13.3 文本聚类分析\t295 13.4 LDA主题模型\t306 13.5 人物社交网络分析\t312 本章小结\t318 附录 Pyecharts本地加载渲染js图\t319 导语 1.从Python程序设计基础入手,深入讲解数据分析的相关包及数据分析方法 2.将数值、网络、文本等类型的数据作为案例进行分析,将理论与实际相结合 3.配套资源丰富,配套微课视频,案例数据源,课件,上机实验指导等 主题词 Python |