内容推荐 本书强调理论联系实际,不仅介绍了基础的数据分析方法,而且结合各个行业的特征进行了详细的实务介绍。全书共有12章,包括以下内容:第1章介绍了大数据的基本概念与发展现状。第2章对数据抽取和清洗原理与方法进行了详细的介绍,同时介绍了数据抽取和清洗的ETL工具。第3章介绍了大数据存储技术,包括大数据存储面临的挑战、数据存储的方式、非关系型数据库、常见非关系型系统、分布式文件系统等。第4章介绍了大数据分析方法,包括决策树、神经网络和隐马尔科夫模型三类分类分析方法和基于深度学习的预测方法。第5章介绍了数据挖掘的基本概念以及大数据挖掘的定义与应用,同时概述了文本、语音、图像、空间以及Web数据挖掘的方法。第6章介绍了云计算的基本概念以及云服务的类型,同时分析了云计算技术和大数据的应用。第7章介绍了大数据时代下电子商务发展的新特点、新应用以及新态势。第8章介绍了大数据可视化的相关概念及部分典型大数据可视化工具。第9章主要归纳了各行业中大数据的个性化应用,同时梳理了大数据应用的流程与企业中大数据应用的共性需求。第10章主要研究了大数据时代下的商业智能新概念与应用领域,同时介绍了大数据时代下新型的Hadoop与MPP结合的新架构、云平台以及大数据一体机。第11章指出大数据时代的信息安全面临的挑战及其特征并总结出了应对策略,同时分析了大数据引起的个人隐私问题。第12章介绍了IBM、Oracle、SAS、SAP、腾讯、阿里、用友等部分大数据主流厂商的大数据解决方案。 本书适合作为了解大数据基本知识和相关技术的入门教材,也可以作为高校的通识课教材。 目录 第1章 大数据概述 1 大数据的产生与发展 2 大数据的概念 3 大数据的研究与发展现状 4 大数据的应用现状 5 大数据时代面临的新挑战 6 小结 思考题 参考文献 第2章 数据抽取和清洗 1 数据的抽取 2 数据的清洗 3 大数据的ETL处理 4 常见的ETL工具案例 5 小结 思考题 参考文献 第3章 大数据存储技术 1 大数据存储面临的挑战 2 数据存储的方式 3 非关系型数据库 4 常见的非关系型案例 5 分布式文件系统 6 小结 思考题 参考文献 第4章 大数据分类分析方法 1 大数据分类分析方法的由来 2 数据分类方法 3 基于深度学习的预测方法 4 大数据分析实例 5 小结 思考题 参考文献 第5章 大数据分析与数据挖掘 1 传统数据挖掘 2 大数据与数据挖掘 3 大数据挖掘 4 文本挖掘 5 语音大数据挖掘 6 图像识别与分析 7 空间数据挖掘 8 Web数据挖掘 9 小结 思考题 参考文献 第6章 大数据与云计算 1 云计算概述 2 云架构与云计算技术 3 大数据走向云端 4 云计算下的大数据工程 5 云计算下大数据的应用 6 小结 思考题 参考文献 第7章 大数据与电子商务 1 电子商务应用大数据的新机遇 2 大数据背景下的电子商务新特点 3 大数据在电子商务中的新应用 4 小结 思考题 参考文献 第8章 大数据可视化分析 1 大数据可视化概述 2 大数据可视化技术 3 大数据可视化工具 4 可视化案例 5 可视化发展趋势 6 小结 思考题 参考文献 第9章 大数据在各行业的应用 1 大数据应用的流程及价值 2 互联网与大数据 3 金融业与大数据 4 交通业与大数据 5 政府与大数据 6 其他行业与大数据 7 大数据应用的共性需求 8 小结 思考题 参考文献 第10章 大数据下的商业智能与平台架构 1 传统概念下的商业智能 2 传统商业智能面临的挑战 3 商业智能Hadoop+MPP新架构 4 商业智能与云平台 5 多平台共存的大数据一体机 6 大数据商业智能的优势和发展趋势 7 小结 思考题 参考文献 第11章 大数据时代的信息安全与个人隐私 1 大数据时代的信息安全及其特征 2 大数据信息安全应对模式与信息保障 3 大数据带来的个人隐私问题及其危害 4 大数据时代的个人隐私如何保护 5 小结 思考题 参考文献 第12章 大数据主流厂商解决方案 1 大数据主流厂商概述 2 IBM大数据解决方案 3 SAS大数据解决方案 4 Oracle大数据解决方案 5 Microsoft大数据解决方案 6 SAP与Sybase大数据解决方案 7 EMC大数据解决方案 8 腾讯大数据解决方案 9 阿里巴巴大数据解决方案 10 用友大数据解决方案 11 小结 思考题 参考文献 |