![]()
内容推荐 本书是第一本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。 目录 Preface Part I.The Data Science Lifecycle 1.The Data Science Lifecycle 2.Questions and Data Scope 3.Simulation and Data Design 4.Modeling with Summary Statistics 5.Case Study: Why Is My Bus Always Late Part II.Rectangular Data 6.Working with Dataframes Using pandas 7.Working with Relations Using SQL Part III.Understanding The Data 8.Wrangling Files 9.Wrangling Dataframes 10.Exploratory Data Analysis 11.Data Visualization 12.Case Study: How Accurate Are Air Quality Measurements Part IV.Other Data Sources 13.Working with Text 14.Data Exchange 导语 作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据 —— 无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。 书评(媒体评论) “我真希望在第一次用‘数据科学家’这个词 来描述做我们所做工作的人时能有这本书。如果你 想从事数据科学/工程、AI或机器学习,这本书就是 你的起点。” —— DJ Patil博士 美国第一位首席数据科学家 |