网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python数据挖掘(概念方法与实践)/数据分析与决策技术丛书
分类
作者 (美)梅甘·斯夸尔
出版社 机械工业出版社
下载
简介
编辑推荐

梅甘·斯夸尔著的《Python数据挖掘(概念方法与实践)》将深入许多数据挖掘中常被忽视的领域,包括关联规则挖掘、实体匹配、网络挖掘、情绪分析、命名实体识别、文本摘要、主题建模和异常检测。对于每种数据挖掘技术,我们将在比较解决每种问题所用的各种策略之前,研究目前最新的最佳实践。然后,用软件工程领域的实际数据实现示例解决方案,并理解和解读所得结果。

读完本书,你将在实施某些当今最有趣、最有意义的数据挖掘技术上积累扎实的经验,并在Python数据分析的重要领域中拥有更娴熟的技巧。

内容推荐

数据挖掘是数据科学流水线中不可分割的一部分。它是任何成功的数据驱动策略的基础——没有它,你就永远无法真正得到有变革意义的深刻认识。由于数据对于每个现代化组织都至关重要,那么采取进一步的行动以获取更大价值、获得更有意义的理解,是值得的。

梅甘·斯夸尔著的《Python数据挖掘(概念方法与实践)》使用Python编程语言和基于项目的方法介绍多种常被忽视的数据挖掘概念,如关联规则、实体匹配、网络分析、文本挖掘和异常检测。每个章节都全面阐述某种特定数据挖掘技术的基础知识,提供替代方案以评估其有效性,并用真实的数据实现该技术,帮助你“知其然,知其所以然”,从而迈向数据挖掘专家的道路。

目录

译者序

关于审稿人

前言

第1章 扩展你的数据挖掘工具箱

 1.1 什么是数据挖掘

 1.2 如何进行数据挖掘

1.2.1 Fayyad等人的KDD过程

1.2.2 韩家炜等人的KDD过程

1.2.3 CRISP-DM过程

1.2.4 六步过程

1.2.5 哪一种数据挖掘方法最好

 1.3 在数据挖掘中使用哪些技术

 1.4 如何建立数据挖掘工作环境

 1.5 小结

第2章 关联规则挖掘

 2.1 什么是频繁项集

2.1.1 都市传奇“尿布与啤酒”

2.1.2 频繁项集挖掘基础知识

 2.2 迈向关联规则

2.2.1 支持度

2.2.2 置信度

2.2.3 关联规则

2.2.4 包含数据的示例

2.2.5 附加值—修复计划中的漏洞

2.2.6 寻找频繁项集的方法

 2.3 项目—发现软件项目标签中的关联规则

 2.4 小结

第3章 实体匹配

 3.1 什么是实体匹配

3.1.1 数据合并

3.1.2 匹配技术

3.1.3 基于属性的相似度匹配

3.1.4 属性匹配方法

3.1.5 利用不相交数据集

3.1.6 基于上下文的相似度匹配

3.1.7 基于机器学习的实体匹配

3.1.8 实体匹配技术的评估

 3.2 实体匹配项目

3.2.1 软件项目匹配的难度

3.2.2 两个例子

3.2.3 根据项目名称匹配

3.2.4 根据人名匹配

3.2.5 根据URL匹配

3.2.6 按照主题和描述关键词匹配

3.2.7 数据集

3.2.8 代码

3.2.9 结果

 3.3 小结

第4章 网络分析

 4.1 什么是网络

 4.2 网络计量

4.2.1 网络的度数

4.2.2 网络直径

4.2.3 网络中的通路、路径和迹

4.2.4 网络的成分

4.2.5 图的中心性

 4.3 图数据的表示

4.3.1 邻接矩阵

4.3.2 边表和邻接表

4.3.3 图数据结构之间的差别

4.3.4 将数据导入图结构中

 4.4 真实项目

4.4.1 探索数据

4.4.2 生成网络文件

4.4.3 以网络的形式理解数据

 4.5 小结

第5章 文本情绪分析

 5.1 什么是情绪分析

 5.2 情绪分析基础知识

5.2.1 观点的结构

5.2.2 文档级和句子级分析

5.2.3 观点的重要特征

 5.3 情绪分析算法

 5.4 情绪挖掘应用

5.4.1 项目动机

5.4.2 数据准备

5.4.3 聊天消息的数据分析

5.4.4 电子邮件消息的数据分析

 5.5 小结

第6章 文本中的命名实体识别

 6.1 为什么寻找命名实体?

 6.2 命名实体识别技术

 6.3 NER系统的构建与评估

6.3.1 NER和部分匹配

6.3.2 处理部分匹配

 6.4 命名实体识别项目

 6.5 小结

第7章 自动化文本摘要

 7.1 什么是自动化文本摘要

 7.2 文本摘要工具

7.2.1 使用NTLK的简单文本摘要

7.2.2 使用Gensim的文本摘要

7.2.3 使用Sumy的文本摘要

 7.3 小结

第8章 文本中的主题建模

 8.1 什么是主题建模

 8.2 潜在狄利克雷分配

 8.3 Gensim主题建模

8.3.1 理解Gensim LDA主题

8.3.2 理解Gensim LDA的遍数

8.3.3 对新文档应用Gensim LDA模型

8.3.4 序列化Gensim LDA对象

 8.4 用于更大项目的Gensim LDA

 8.5 小结

第9章 挖掘数据异常

 9.1 什么是数据异常

9.1.1 缺失数据

9.1.2 修复缺失数据

9.1.3 数据错误

9.1.4 离群值

 9.2 小结

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/1 19:10:19