内容推荐 本书主要介绍了高性能计算机体系结构的基础知识和核心原理。其中第1、2章介绍了高性能计算机的基本概念、性能评价、应用领域及基准评测集;第3章介绍了高性能计算机体系结构的分类和代表性体系结构;第4~6章从并行计算技术、存储层次以及互连网络等方面介绍了高性能计算机的关键技术;第7章介绍了典型的异构计算体系结构;第8章讲述了应用于特定领域的专用体系结构。本书以计算机系统思维能力培养为主线,使得读者能够初步掌握高性能计算机的设计与分析方法,熟悉高性能计算机的体系架构,了解性能评测基本手段和方法。 本书可作为普通高等学校计算机相关专业高年级本科生、研究生的教材,也可供相关领域专业人员,如研究科学家、研发工程师或系统架构师等参考使用。 目录 前言 第1章 高性能计算机概述 1.1 基本概念 1.1.1 计算机性能 1.1.2 高性能计算机的定义 1.1.3 并行计算 1.2 典型高性能计算机的结构剖析 1.3 高性能计算机的性能评价 1.3.1 峰值性能 1.3.2 加速比和效率 1.3.3 Amdahl定律 1.3.4 Gustafson定律 1.3.5 可扩展性 1.4 高性能计算机的应用领域 1.4.1 尺度超大类问题 1.4.2 尺度超小类问题 1.4.3 时变超快类问题 1.4.4 时变超慢类问题 1.4.5 过程超危险类问题 1.4.6 过程超昂贵类问题 1.4.7 新兴领域应用问题 1.5 高性能计算机的演进和发展趋势 1.5.1 高性能计算机的发展历史 1.5.2 国产高性能计算机的发展历程 1.5.3 高性能计算机的未来发展趋势 1.6 本章小结 课后习题 第2章 基准评测集 2.1 基准评测介绍 2.2 计算性能评测集 2.2.1 LINPACK 2.2.2 HPCG 2.2.3 Graph 2.3 I/O性能评测集 2.3.1 MDTest 2.3.2 IOR 2.3.3 IO 2.4 网络性能评测集 2.4.1 IMB 2.4.2 OSU Benchmark 2.5 能耗评测集 2.6 应用评测集 2.6.1 Miniapplication 2.6.2 戈登·贝尔奖 2.7 本章小结 课后习题 第3章 高性能计算机的体系结构分类 3.1 Flynn分类法 3.1.1 SISD 3.1.2 SIMD 3.1.3 MISD 3.1.4 MIMD 3.1.5 SIMT 3.1.6 计算机体系结构分类图谱 3.2 共享内存系统 3.2.1 集中式共享内存系统 3.2.2 分布式共享内存系统 3.3 分布式内存系统 3.3.1 大规模并行处理系统 3.3.2 工作站集群系统 3.4 高性能计算机体系结构中的重要技术 3.4.1 缓存一致性 3.4.2 内存一致性 3.4.3 同步 3.4.4 互连网络 3.5 非冯·诺依曼体系结构计算机 3.5.1 冯·诺依曼体系结构的回顾 3.5.2 非冯·诺依曼体系结构简介 3.6 本章小结 课后习题 第4章 高性能处理器的并行计算技术 4.1 指令级并行 4.1.1 流水线技术 4.1.2 指令相关性 4.1.3 流水线冒险 4.1.4 处理冒险的技术 4.1.5 精准异常的处理 4.1.6 分支预测 4.1.7 ILP增强技术 4.2 线程级并行 4.2.1 粗粒度多线程并行 4.2.2 细粒度多线程并行 4.2.3 同步多线程并行 4.3 数据级并行 4.3.1 SIMD指令集扩展 4.3.2 图形处理器 4.4 本章小结 课后习题 第5章 高性能计算机的存储层次 5.1 存储层次结构 5.2 缓存一致性 5.2.1 基于侦听的缓存一致性协议 5.2.2 基于目录的缓存一致性协议 5.2.3 一致性的伪共享现象 5.3 内存一致性问题 5.3.1 顺序一致性 5.3.2 松弛一致性 5.4 内存屏障方法 5.4.1 编译器内存同步 5.4.2 CPU内存同步 5.4.3 无锁同步 5.5 本章小结 课后习题 第6章 高性能计算机的互连网络 6.1 基本定义和评价指标 6.2 拓扑结构 6.2.1 静态网络 6.2.2 动态网络 6.3 流控机制 6.3.1 基于消息的流量控制 6.3.2 基于包的流量控制 6.3.3 基于片的流量控制 6.3.4 基于信用量的流量控制 6.4 路由算法 6.4.1 路由死锁问题 6.4.2 路由算法的分类 6.5 InfiniBand高性能互连网络 6.5.1 InfiniBand层次结构 6.5.2 InfiniBand网络架构 6.6 RDMA协议 6.6.1 常见的RDMA技术 6.6.2 RDMA与传统协议对比 6.7 本章小结 课后习题 第7章 异构计算体系结构 7.1 异构计算的基本概念 7.2 CPU+GPU异构计算 7.2.1 CPU与GPU的对比 7.2.2 GPU的架构 7.2.3 CUDA编程模型 7.2.4 CUDA内存模型 7.2.5 CUDA执行模型 7.3 CPU+FPGA异构计算 7.3.1 FPGA的基本架构 7.3.2 OpenCL编程模型 7.3.3 OpenCL内存模型 7.3.4 OpenCL执行模型 7.4 本章小结 课后习题 第8章 领域专用体系结构 8.1 面向深度神经网络的领域专用体系结构 8.1.1 深度神经网络简介 8.1.2 张量处理单元 8.1.3 神经网络处理单元 8.1.4 神经网络领域专用体系结构未来展望 8.2 面向类脑计算的领域专用体系结构 8.2.1 类脑计算简介 8.2.2 清华大学“天机”类脑体系结构 8.2.3 其他类脑体系结构 8.3 面向图计算的领域专用体系结构 8.3.1 图计算 8.3.2 面向图计算的领域专用体系结构分类 8.4 本章小结 课后习题 参考文献 |