本书笫2版最完整、最全面地讲述了数据挖掘领域的重要知识和技术创新。相比内容已经相当全面的第1版,第2版展示了该领域的最新研究成果,例如挖掘流、时序数据和序列数据以及挖掘空间、多媒体、文本和IWeb数据。本书是数据挖掘和知识发现领域内所有教师、研究人员、开发人员和用户部必读的一本书。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据挖掘(概念与技术英文版第2版)/经典原版书库 |
分类 | |
作者 | (加)韩家炜 |
出版社 | 机械工业出版社 |
下载 | ![]() |
简介 | 编辑推荐 本书笫2版最完整、最全面地讲述了数据挖掘领域的重要知识和技术创新。相比内容已经相当全面的第1版,第2版展示了该领域的最新研究成果,例如挖掘流、时序数据和序列数据以及挖掘空间、多媒体、文本和IWeb数据。本书是数据挖掘和知识发现领域内所有教师、研究人员、开发人员和用户部必读的一本书。 内容推荐 我们产生和收集数据的能力正在快速增长。除了大多数商业、科学和政府事务的日益计算机化会产生数据之外,数码相机、发布工具和条码的广泛应用也会产生数据。在数据收集方面,扫描的文本和图像平台、卫星遥感系统和国际互联网已经使我们的生活被巨大的数据量所包围。这种爆炸性的数据增长促使我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。 本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。但是,自第1版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强,增加了多个章节讲述最新的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。 本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材,同时也可供从事数据挖掘研究和应用开发工作的相关人员作为必备的参考书。 目录 Foreword vii Preface ix Chapter Introduction I 1.1 What Motivated Data Mining? Why Is It Important? 1 1.2 So, What Is Data Mining? 5 1.3 Data Mining-On What Kind of Data? 9 1.3.1 Relational Databases 10 1.3.2 Data Warehouses 12 1.3.3 TransactionalDatabases 14 1.3.4 Advanced Data and Information Systems and Advanced Applications 15 1.4 Data Mining Functionalities---What Kinds of Patterns Can Be Mined? 21 1.4.1 Concept/Class Description: Characterization and Discrimination 21 1.4.2 Mining Frequent Patterns, Associations, and Correlations 23 1.4.3 Classification and Prediction 24 1.4.4 Cluster Analysis 25 1.4.5 Outlier Analysis 26 1.4.6 Evolution Analysis 27 1.5 Are All of the Patterns Interesting? 27 1.6 Classification of Data Mining Systems 29 1.7 Data Mining Task Primitives 3 I 1.8 Integration of a Data Mining System with a Database or Data Warehouse System 34 1.9 Major Issues in Data Mining 36 1.10 Summary 39 Exercises 40 Bibliographic Notes 42 Chapter Data Preprocessing 47 2.1 Why Preprocess the Data? 48 2.2 Descriptive Data Summarization 51 2.2.1 Measuring the Central Tendency 5 I 2.2.2 Measuring the Dispersion of Data 53 2.2.3 Graphic Displays of Basic Descriptive Data Summaries 56 2.3 Data Cleaning 61 2.3.1 Missing Values 61 2.3.2 Noisy Data 62 2.3.3 Data Cleaning as a Process 65 2.4 Data Integration and Transformation 67 2.4.1 Data Integration 67 2.4.2 Data Transformation 70 2.5 Data Reduction 72 2.5.1 Data Cube Aggregation 73 2.5.2 Attribute Subset Selection 75 2,5.3 DimensionalityReduction 77 2.5.4 Numerosity Reduction 80 2.6 Data Discretization and Concept Hierarchy Generation 86 2.6.1 Discretization and Concept Hierarchy Generation for Numerical Data 88 2.6.2 Concept Hierarchy Generation for Categorical Data 94 2.7 Summary 97 Exercises 97 Bibliographic Notes 101 Chapter 3 Data Warehouse and OLAP Technology: An Overview 105 3.1 What Is a Data Warehouse? 105 3. I.I Differences between Operational Database Systems and Data Warehouses 108 3.1.2 But, Why Have a Separate Data Warehouse? 109 3.2 A Multidimensional Data Model 110 3.2.1 From Tables and Spreadsheets to Data Cubes 110 3.2.2 Stars, Snowflakes, and Fact Constellations: Schemas for Multidimensional Databases 114 3.2.3 Examples for Defining Star, Snowflake, and Fact Constellation Schemas 117 …… |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。