网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 基于CUDA的并行程序设计
分类 计算机-操作系统
作者 刘金硕//邓娟//周峥//曾秋梅
出版社 科学出版社
下载
简介
编辑推荐

刘金硕、邓娟、周峥、曾秋梅等编著的《基于CUDA的并行程序设计》的主要内容分为基础理论部分和应用实例部分。基础理论部分包括:并行计算概述、GPU概述、CUDA编程基础、GPU存储器使用技巧和CUDA编程优化等。应用实例部分包括:基于C++的遥感影像处理的CUDA优化、基于OpenGL的体绘制技术实现剪切波数据三维可视化的CUDA优化、基于MATLAB的生物细胞图像病理诊断的CUDA优化和基于CUDA的核外计算集群中间件等。通过对学习本书,读者可以充分理解并行计算和GPU架构、熟练掌握CUDA架构下的多种语言的并行编程技术。

内容推荐

刘金硕、邓娟、周峥、曾秋梅等编著的《基于CUDA的并行程序设计》主要介绍基于CUDA的并行程序设计的原理、开发方法和硬件基础,并给出了应用实例。全书内容共9章。第1~5章为基础知识部分,介绍CUDA并行程序设计的原理和开发环境,包括并行计算概述、GPU概述、CUDA编程基础、GPU存储器使用技巧和CUDA编程优化。第6~9章为应用实例部分,分别详细讲解基于C++的遥感影像处理的CUDA优化、基于OpenGL的体绘制技术实现剪切波数据三维可视化的CUDA优化、基于MATLAB的生物细胞图像病理诊断的CUDA优化和基于CUDA的核外计算集群中间件技术。书中包含实例代码,需要读者具有一定的编程开发基础。

《基于CUDA的并行程序设计》适合高等院校计算机、电子工程、通信工程等相关专业的教师、研究生阅读,也可供从事CUDA设计与开发的科研技术人员、程序员参考。

目录

前言

第1章 并行计算概述

 1.1 并行计算简介

 1.2 并行处理的计算机体系结构

1.2.1 并行计算机分类

1.2.2 并行计算机的物理结构模型

 1.3 并行算法的设计方法

1.3.1 并行算法的相关概念

1.3.2 设计并行算法应注意的问题

1.3.3 并行算法的通用设计方法

 1.4 基于各种并行处理体系结构的算法对比

1.4.1 SIMD算法

1.4.2 MIMD算法

1.4.3 MIMD进程通信和死锁

1.4.4 MIMD任务调度

 1.5 小结

 参考文献

第2章GPU概述

 2.1 GPU的发展

 2.2 GPU的体系结构

2.2.1 NVIDIA公司的GPU体系结构

2.2.2 AMD公司的GPU体系结构

 2.3 多核CPU和GPU的协同工作原理

 2.4 GPU并行与分布式对比

 2.5 采用多核CPU和GPU的异构集群

 2.6 小结

 参考文献

第3章 CUDA编程基础

 3.1 CUDA简介

 3.2 CUDA并行新思维

 3.3 CUDA的安装及配置

3.3.1 CUDA在Mac OS X中的配置

3.3.2 CUDA在Linux中的配置

3.3.3 CUDA存Windows中的配置

 3.4 CUDA编程模型

3.4.1 CUDA C语言

3.4.2 执行结构

3.4.3 内核函数

3.4.4 线程层次

3.4.5 存储器结构与线程映射机制

3.4.6 通信机制

3.4.7 CUDA的软件体系

 3.5 nvcc编译器

3.5.1 nvcc编译流程

3.5.2 兼容性分析

 3.6 “Helloworld”CUDA编程实例

 3.7 小结

 参考文献

第4章 GPU存储器使用技巧

 4.1 GPU的8种存储器及其访问机制

 4.2 全局存储器的使用技巧

 4.3 共享存储器的使用技巧

 4.4 纹理存储器的使用技巧

4.4.1 纹理存储器的特性

4.4.2 绑定到纹理的数据类型

4.4.3 纹理参考声明

4.4.4 运行时纹理参考属性

4.4.5 纹理存储器的使用方法

 4.5 主机端页锁定内存的使用技巧

4.5.1 页锁定内存的特性

4.5.2 零复制(zero—copy)

4.5.3 异步执行

 4.6 小结

 参考文献

第5章 CUDA编程优化

 5.1 概述

 5.2 性能分析

5.2.1 测时

5.2.2 CUDA程序性能分析工具

5.2.3 CUDA程序性能分析和优化

 5.3 存储器访问优化

 5.4 任务划分

 5.5 指令优化

5.5.1 存储器访问的指令优化

5.5.2 算术运算的指令优化

5.5.3 线程同步的指令优化

5.5.4 控制流的指令优化

 5.6 优化实例

 5.7 小结

 参考文献

第6章 基于C++的遥感影像处理的CUDA优化

 6.1 遥感影像常用处理算法的GPU加速

6.1.1 均值滤波算法的CUDA并行化优化

6.1.2 高斯滤波算法的CUDA并行化优化

6.1.3 大图像分块的均值和方差算法

6.1.4 图像处理算法的串并行实验结果对比与分析

 6.2 基于CUDA的SAR影像SIFT匹配

6.2.1 遥感影像数据采集和影像几何特征

6.2.2 SIFT匹配算法原理

6.2.3 SIFT匹配算法的CUDA并行化优化

 6.3 水平集曲线演化算法用于遥感图像轮廓提取

6.3.1 遥感图像轮廓提取技术

6.3.2 水平集曲线演化方法

6.3.3 水平集曲线演化算法的CUDA并行优化

 6.4 小结

 参考文献

第7章 基于OpenGL的体绘制技术实现剪切波数据三维可视化的CUDA优化

 7.1 地震剪切波数据的三维可视化

 7.2 体绘制技术和光线投射算法

 7.3 基于OpentGL的CUDA编程

 7.4 基于0pemGL的cuDA光线投射算法设计

7.4.1 光线投射算法模型设计

7.4.2 光线投射算法流程

7.4.3 基于CUDA的光线投射算法设计

7.4.4 可变采样步长优化方法

 7.5 体绘制效率提升的GPU访存优化策略

7.5.1 采用纹理存储器策略的体绘制算法优化

7.5.2 采用全局存储器策略的体绘制算法优化

7.5.3 采用全局+共享策略的体绘制算法优化

7.5.4 采用常量存储器策略的体绘制算法优化

7.5.5 采用纹理存储器的体绘制

 7.6 GPU访存优化策略效率分析

 7.7 剪切波三维可视化GPU加速实验结果与分析

7.7.1 准备工作

7.7.2 串并行实现光线投射算法的实验对比

7.7.3 中国大陆南北带地区剪切波速度数据的可视化结果与分析

 7.8 小结

 参考文献

第8章 基于MATLAB的生物细胞图像病理诊断的CUDA优化

 8.1 真菌隐球酵母菌病理诊断

 8.2 基于MATLAB的CUDA编程

 8.3 基于MATLAB的高噪声细胞图像处理的CuDA实现

8.3.1 imadiust灰度调整算法加速

8.3.2 imerode腐蚀算法加速

8.3.3 imtophat高帽滤波算法加速

 8.4 实验结果与分析

 8.5 小结

 参考文献

第9章 基于CUDA的核外计算集群中间件

 9.1 基于CuDA的中间件技术

9.1.1 中间件技术介绍

9.1.2 DataCutter混合编程架构

 9.2 分布式核外计算中间件

9.2.1 核外计算技术

9.2.2 基于CIIDA的混合分布式全局数据管理

9.2.3 分布式数据服务协议

9.2.4 基于感知的任务调度策略

9.2.5 DOoC中间件

 9.3 中间件编程接口

9.3.1 LAF编程框架

9.3.2 DOoC+LAF架构

 9.4 实验结果与分析

9.4.1 实验环境

9.4.2 外存访问与混合计算能力测试

9.4.3 MFDn绿色计算测试

9.4.4 特征值求解器

 9.5 小结

 参考文献

附录A 数学函数

附录B 原子函数

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/1 5:18:54