网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 OpenCL异构计算
分类 计算机-操作系统
作者 贾斯特
出版社 清华大学出版社
下载
简介
编辑推荐

《OpenCL异构计算》编著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。  

本书可帮助学生和研究人员更好地理解通用异构计算(尤其是opencl提供的解决方案),尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。

内容推荐

《OpenCL异构计算》编著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。 

《opencl异构计算》提供opencl的第一手资料,详尽阐述了如何在异构环境下进行并行编程。第1章首先介绍如何在并行系统下编程,定义异构编程需要理解的概念。第2~4章循序渐进地介绍opencl的基本架构。第5章和第6章对这些概念加以扩展,旨在帮助读者更好地理解。第7~10章提供4个更复杂的案例学习,让读者理解到opencl具有广泛的应用。第11~13章锁定高级主题展开讨论。  本书可帮助学生和研究人员更好地理解通用异构计算(尤其是opencl提供的解决方案),尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。

目录

第一章 并行编程入门 

引言 

opencl 

本书目标 

并行思维 

并发编程模型和并行编程模型 

线程和共享内存 

消息传递通信 

不同的并行粒度 

数据共享和同步 

本书结构 

参考文献 

扩展阅读和相关网站 

第二章 opencl简介 

引言 

opencl标准 

opencl 规范 

kernel和opencl执行模型 

平台和设备 

主机-设备交互 

执行环境 

上下文 

命令队列 

事件 

内存对象 

flush命令和finish命令 

新建一个opencl程序对象 

opencl的kernel 

内存模型 

编写kernel 

向量相加实例的完整代码 

小结 

参考文献 

第三章 opencl设备架构 

引言 

硬件权衡 

性能随频率的提升及其限制 

超标量执行 

vliw 

simd和向量处理 

硬件多线程 

多核架构 

集成:片上系统和apu 

高速缓存层次和内存系统 

架构设计空间 

cpu设计 

gpu体系结构 

apu和类apu的设计 

小结 

参考文献 

第四章 opencl基本实例 

引言 

应用实例 

简单的矩阵相乘 

图像卷积实例 

小结 

第五章 opencl的并发与执行模型 

引言 

kernel,work_item,workgroup和

执行域 

opencl同步:kernel,fence和barrier 

队列与全局同步 

opencl内存一致性 事件 

命令barrier与marker 

主机端内存模型 

buffer对象 

image对象 

设备端内存模型 

设备端宽松的内存一致性 

全局内存 

本地内存 

常量内存 

私有内存 

小结 

六章 opencl在cpu/gpu

平台上的实现 

引言 

opencl在amd phenom ii x上的

实现 

opencl在amd radeon hd

gpu上的实现 

多线程和内存系统 

基于clause的simd执行 

资源分配 

opencl的内存性能 

opencl全局内存 

本地内存——软件管理的cache 

小结 

参考文献 

第七章 opencl案例学习:卷积 

引言 

计算卷积的kernel 

选择合适的workgroup大小 

将数据缓存到本地内存 

执行卷积 

小结 

代码清单 

主机端代码 

kernel代码 

参考文献 

第八章 opencl案例学习:

视频处理 

引言 

获得视频帧 

cpu上的解码 

在gpu上解码视频 

在opencl中处理一个视频 

在多个视频上处理多个不同effect 

事件链 

最终输出显示到屏幕 

opencl/opengl协同工作能力 

小结 

第九章 opencl案例学习:直方图 

引言 

选择适量的work-group 

选择最优的work-group大小 

全局内存访存优化 

使用原子操作计算局部直方图 

本地内存访存优化 

局部直方图的规约 

全局规约 

完整的kernel代码 

性能和小结 

第十章 opencl案例学习:

混合粒子模拟 

引言 

计算概览 

gpu实现 

创建buffer 

构造加速结构 

计算碰撞 

合成 

cpu实现 

负载均衡 

性能和小结 

生成均匀网格的kernel代码 

粒子模拟的kernel代码 

第十一章 opencl扩展 

引言 

扩展机制概览 

设备拆分 

双精度 

参考文献 

第十二章 opencl的性能剖析和

调试 

引言 

基于事件的剖析 

amd app profiler 

收集opencl程序轨迹 

收集opencl gpu kernel性能

计数器 

amd app kernelanalyzer 

演示amd app profiler 

启动amd app profiler 

使用应用程序的轨迹数据

以发现性能瓶颈 

使用gpu性能计数器发现kernel的

性能瓶颈 

调试opencl应用程序 

gdebugger概览 

使用gdebugger调试并行opencl

应用程序 

amd printf扩展 

小结 

第十三章 webcl 

引言 

框架设计 

webcl 实验性实现 

firefox扩展 

连接javascript和opencl 

webcl动手练习 

web照片编辑器 

讨论 

小结 

参考文献 

扩展阅读和相关网站 

索引

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/5/2 14:37:00