![]()
内容推荐
在信息爆炸的时代,网络就是一个庞大的资源库,不论是「想找出大力度优惠的商品价格」、「想知道竞争者的商品信息」、「分析时下流行的趋势」、「想了解历史股价」、「分析球员的打击率、得分率」、「分析点阅率优选的影片做为营销决策」、……等等,都可以轻易取得各种数据。
虽然数据来源不是问题,但要抓取、整理、分析庞大的数据,就需要一些工具及方法才能有效率地完成。本书实际教您使用 Python 的 Beautiful Soup、Pandas、Selenium 及 Scrapy 来建立爬虫程序,并依不同的网页型态使用对应的工具来抓取数据。在取得和储存数据后,教您利用 Python的Matplotlib、Pandas、SeaBorn、Bokeh,将数据以可视化的方式呈现,让决策者能快速理解数据的【模式】、【趋势】和【关联性】。
目录
【Part 1 建立 Python 爬虫程序 - 从网页取得数据】
CHAPTER1 HTML、JSON 与网络爬虫的基础 CHAPTER 2 从网络取得数据 CHAPTER 3 撷取静态 HTML 网页数据 CHAPTER 4 使用 CSS 选择器爬取数据 CHAPTER 5 走访 HTML 网页取出数据与数据储存 CHAPTER 6 使用 XPath 表达式与 lxml 套件建立爬虫程序 CHAPTER 7 Selenium 窗体互动与动态网页撷取 CHAPTER 8 Scrapy 爬虫框架 CHAPTER 9 Python 爬虫程序实作案例 CHAPTER 10 将爬取数据存入 MySQL 数据库
【Part 2 Python 数据可视化 - 大数据分析】
CHAPTER11 认识大数据分析-数据可视化 CHAPTER 12 使用 Pandas 掌握你的数据 CHAPTER 13 Matplotlib 与 Pandas 数据可视化 CHAPTER 14 Seaborn 统计资料可视化 CHAPTER 15 Bokeh 互动图表与仪表板 CHAPTER 16 Python 资料可视化实作案例
|