内容推荐 佩瑟鲁·拉吉、阿诺帕马·拉曼、德维亚·纳加拉杰、悉达多·杜格拉拉著的《高性能计算系统与大数据分析/数据科学与工程技术丛书》介绍了大数据分析所需的高性能基础设施以及高性能大数据分析领域的新技术和工具。在新兴分析类型方面,涵盖了传感器分析、机器分析、运营分析、实时分析、高性能分析、社交媒体和网络分析、客户情绪分析、品牌优化分析、金融交易及趋势分析、零售分析、能量分析、药物分析以及效用分析等。在IT基础设施方面,则包含了大型机、并行和超级计算系统、P2P、集群和网格计算系统设备、专业集成和按需定制的系统、实时系统、云基础设施等。 本书适合作为高校大数据、高性能计算相关课程的教材,也适合业务主管、技术专家、软件工程师、大数据科学家、解决方案架构师等专业人士阅读。 目录 译者序 序 前言 第1章 IT领域的变革以及未来趋势 1.1 引言 1.2 新兴的IT趋势 1.3 数字化实体的实现与发展 1.4 物联网/万物互联 1.5 对社交媒体网站的广泛采用 1.6 预测性、规范性、个性化分析时代 1.7 用于大数据及分析的Apache Hadoop 1.8 大数据、大洞见、大动作 1.9 结论 1.10 习题 第2章 大数据/快速数据分析中的高性能技术 2.1 引言 2.2 大数据分析学科的出现 2.3 大数据的战略意义 2.4 大数据分析的挑战 2.5 高性能计算范型 2.6 通过并行实现高性能的方法 2.7 集群计算 2.8 网格计算 2.9 云计算 2.10 异构计算 2.11 用于高性能计算的大型机 2.12 用于大数据分析的超级计算 2.13 用于大数据分析的设备 2.13.1 用于大规模数据分析的数据仓库设备 2.13.2 in-memory大数据分析 2.13.3 大数据的in-database处理 2.13.4 基于Hadoop的大数据设备 2.13.5 高性能大数据存储设备 2.14 结论 2.15 习题 参考文献 第3章 大数据与快速数据分析对高性能计算的渴望 3.1 引言 3.2 重新审视大数据分析范型 3.3 大数据和快速数据的含义 3.4 用于精确、预测性、规范性洞见的新兴数据源 3.5 大数据分析为何不俗 3.6 传统的和新一代的数据分析案例研究 3.7 为何采用基于云的大数据分析 3.8 大数据分析:主要处理步骤 3.9 实时分析 3.10 流分析 3.11 传感器分析 3.11.1 大数据分析与高性能计算的同步:附加价值 3.12 结论 3.13 习题 第4章 高性能大数据分析的网络基础设施 4.1 引言 4.2 当前网络基础设施的局限 4.3 高性能大数据分析网络基础设施的设计方法 4.3.1 网络虚拟化 4.3.2 软件定义网络 4.3.3 网络功能虚拟化 4.4 用于传输大数据的广域网优化 4.5 结论 4.6 习题 参考文献 第5章 高性能大数据分析的存储基础设施 5.1 引言 5.2 直连式存储 5.2.1 DAS的缺点 5.3 存储区域网络 5.3.1 块级访问 5.3.2 文件级访问 5.3.3 对象级访问 5.4 保存大数据的存储基础设施需求 5.5 光纤通道存储区域网络 5.6 互联网协议存储区域网络 5.6.1 以太网光纤通道 5.7 网络附属存储 5.8 用于高性能大数据分析的流行文件系统 5.8.1 Google文件系统 5.8.2 Hadoop分布式文件系统 5.8.3 Panasas 5.8.4 Luster文件系统 5.9 云存储简介 5.9.1 云存储系统的架构模型 5.9.2 存储虚拟化 5.9.3 云存储中使用的存储优化技术 5.9.4 云存储的优点 5.10 结论 5.11 习题 参考文献 进一步阅读 第6章 使用高性能计算进行实时分析 6.1 引言 6.2 支持实时分析的技术 6.2.1 in-memory处理 6.2.2 in-database分析 6.3 大规模在线分析 6.4 通用并行文件系统 6.4.1 GPFS用例 6.5 GPFS客户案例研究 6.5.1 广播公司:VRT 6.5.2 石油公司从Lustre迁移到GPFS 6.6 GPFS:关键的区别 6.6.1 基于GPFS的解决方案 6.7 机器数据分析 6.7.1 Splunk 6.8 运营分析 6.8.1 运营分析中的技术 6.8.2 用例以及运营分析产品 6.8.3 其他IBM运营分析产品 6.9 结论 6.10 习题 第7章 高性能计算范型 7.1 引言 7.2 为何还需要大型机 7.3 大型机中HPC是如何演化的 7.3.1 成本:HPC的一个重要因素 7.3.2 云计算中的集中式HPC 7.3.3 集中式HPC的要求 7.4 HPC远程模拟 7.5 使用HPC的大型机解决方案 7.5.1 智能大型机网格 7.5.2 IMG的工作原理 7.5.3 IMG架构 7.6 架构模型 7.6.1 具有共享磁盘的存储服务器 7.6.2 没有共享磁盘的存储服务器 7.6.3 无存储服务器的通信网络 7.7 对称多处理 7.7.1 什么是SMP 7.7.2 SMP与集群方法 7.7.3 SMP是否真的重要 7.7.4 线程模型 7.7.5 NumaConnect技术 7.8 用于HPC的虚拟化 7.9 大型机方面的创新 7.10 FICON大型机接口 7.11 大型机对手机的支持 7.12 Windows高性能计算 7.13 结论 7.14 习题 第8章 in-database处理与in-memory分析 8.1 引言 8.1.1 分析工作负载与事务工作负载的对比 8.1.2 分析工作负载的演化 8.1.3 传统分析平台 8.2 in-database分析 8.2.1 架构 8.2.2 优点和局限 8.2.3 代表性的系统 8.3 in-memory分析 8.3.1 架构 8.3.2 优点和局限 8.3.3 代表性的系统 8.4 分析设备 8.4.1 Oracle Exalytics 8.4.2 IBM Netezza 8.5 结论 8.6 习题 参考文献 进一步阅读 第9章 大 |