网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python应用实战 爬虫、文本分析与可视化
分类
作者 张丽,张鹏,彭笛
出版社 电子工业出版社
下载
简介
目录
章初识Python1
1.1使用IDLE1
1.2从字符串着手4
1.3复杂数据的福音——列表7
1.3.1创建列表7
1.3.2列表的操作7
1.4处理数据——条件判断9
1.5处理数据——循环11
1.6处理数据进阶——嵌套语句12
1.7函数14
1.8拿来就用——模块16
1.9文件17
1.10处理异常18
第2章网页20
2.1工具准备20
2.2从URL开始21
2.2.1简单获取URL22
2.2.2链接与URL24
2.3编写网页的语言——HTML25
2.3.1创建自己的个网页26
2.3.2标签——创建网页的方块27
2.3.3标签属性30
2.4CSS与class31
2.5JavaScript和id33
2.6网页分析工具36
2.6.1谷歌开发者工具36
2.6.2查看网页结构38
2.6.3定位指定的元素39
2.6.4筛选不同的资源41
2.7网页的快递——HTTP44
2.7.1HTTP请求45
2.7.2HTTP响应46
2.7.3HTTP的应用——Cookie和Session47
2.7.4实战——HTTP的交互过程49
2.8以URL结束52
2.9本章总结55
第3章数据抓取56
3.1工具准备56
3.2Xpath和lxml.html58
3.2.1网页分析利器——lxml58
3.2.2XPath59
3.2.3XPath使用实例60
3.2.4XPath演示61
3.3关于robots.txt62
3.4小试牛刀64
3.4.1过程分析64
3.4.2动手敲代码67
3.4.3小结68
3.4.4扩展68
3.5获取电影数据(上)69
3.5.1过程分析70
3.5.2动手敲代码73
3.5.3小结74
3.6获取电影数据(下)75
3.6.1过程分析76
3.6.2动手敲代码76
3.6.3考虑加强代码的健壮性78
3.6.4小结80
3.7另类的网页抓取80
3.7.1过程分析81
3.7.2动手敲代码84
3.7.3小结85
3.8爬虫与网络机器人85
3.9本章总结86
第4章文本处理87
4.1正则表达式87
4.1.1怎样进行匹配87
4.1.2常用的元字符88
4.2更强的文本工具——Python的re库89
4.2.1匹配对象怎么用91
4.2.2使用regex来搜索91
4.2.3使用regex来替换93
4.2.4更方便查找95
4.2.5re库中的控制标志95
4.2.6replace()和re.sub()98
4.2.7实现更不错的strip()方法99
4.2.8新的拆分方法re.split()100
4.2.9怎样提取中文101
4.3电影数据的处理102
4.3.1提取之前的观察104
4.3.2需要获取哪些数据104
4.3.3多样化的方法111
4.3.4格式化的数据112
4.4本章总结115
第5章数据分析116
5.1工具准备116
5.1.1配置JupyterNotebook116
5.1.2数据生成帮手——Numpy116
5.1.3Pandas中的数据结构118
5.2像一维数组的Series118
5.2.1获取Series信息120
5.2.2Series进行数学运算123
5.2.3对Series进行一些操作124
5.2.4方法串联128
5.2.5操作Series中的字符串数据129
5.2.6小结一下Series130
5.3DataFrame131
5.3.1创建DataFrame132
5.3.2对齐133
5.3.3了解DataFrame134
5.3.4常用DataFrame操作137
5.3.5数据的导入与导出141
5.4简单数据分析145
5.4.1电影评分分布145
5.4.2电影产量趋势146
5.4.3评论人数最多的电影147
5.4.4发行电影最多的国家148
5.5看得见的数据153
5.5.1线图153
5.5.2柱状图155
5.5.3饼图157
5.6matplotlib158
5.6.1绘图方法158
5.6.2子图形及布局160
5.6.3图形大小、颜色和样式163
5.7画一张图来结尾165
5.8本章总结167
内容推荐
欢迎来到Python的世界。本书介绍了Python的语法、数据结构等基础知识,以及经典的Python爬虫、网页文本分析及可视化。在本书中,读者不仅可以与Python“结识”,还会遇到新“朋友”——浏览器的开发者工具,通过它来了解HTML编写网页的语言,并进行结构化的网页分析和所需数据的提取。拿来主义特别适合来类比Python语言中的库,Python将与re、requests、lxml等经典的库组合在一起,自动抓取网页数据的爬虫。Pandas这个工具会对抓取的数据进行文本分析,并实现将枯燥的数据进行漂亮的可视化呈现。千里之行,始于足下,欢迎进入本书的奇妙之旅。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/28 6:31:59