《OpenCL异构计算》编著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。
本书可帮助学生和研究人员更好地理解通用异构计算(尤其是opencl提供的解决方案),尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | OpenCL异构计算 |
分类 | 计算机-操作系统 |
作者 | 贾斯特 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 编辑推荐 《OpenCL异构计算》编著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。 本书可帮助学生和研究人员更好地理解通用异构计算(尤其是opencl提供的解决方案),尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。 内容推荐 《OpenCL异构计算》编著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。 《opencl异构计算》提供opencl的第一手资料,详尽阐述了如何在异构环境下进行并行编程。第1章首先介绍如何在并行系统下编程,定义异构编程需要理解的概念。第2~4章循序渐进地介绍opencl的基本架构。第5章和第6章对这些概念加以扩展,旨在帮助读者更好地理解。第7~10章提供4个更复杂的案例学习,让读者理解到opencl具有广泛的应用。第11~13章锁定高级主题展开讨论。 本书可帮助学生和研究人员更好地理解通用异构计算(尤其是opencl提供的解决方案),尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。 目录 第一章 并行编程入门 引言 opencl 本书目标 并行思维 并发编程模型和并行编程模型 线程和共享内存 消息传递通信 不同的并行粒度 数据共享和同步 本书结构 参考文献 扩展阅读和相关网站 第二章 opencl简介 引言 opencl标准 opencl 规范 kernel和opencl执行模型 平台和设备 主机-设备交互 执行环境 上下文 命令队列 事件 内存对象 flush命令和finish命令 新建一个opencl程序对象 opencl的kernel 内存模型 编写kernel 向量相加实例的完整代码 小结 参考文献 第三章 opencl设备架构 引言 硬件权衡 性能随频率的提升及其限制 超标量执行 vliw simd和向量处理 硬件多线程 多核架构 集成:片上系统和apu 高速缓存层次和内存系统 架构设计空间 cpu设计 gpu体系结构 apu和类apu的设计 小结 参考文献 第四章 opencl基本实例 引言 应用实例 简单的矩阵相乘 图像卷积实例 小结 第五章 opencl的并发与执行模型 引言 kernel,work_item,workgroup和 执行域 opencl同步:kernel,fence和barrier 队列与全局同步 opencl内存一致性 事件 命令barrier与marker 主机端内存模型 buffer对象 image对象 设备端内存模型 设备端宽松的内存一致性 全局内存 本地内存 常量内存 私有内存 小结 第 六章 opencl在cpu/gpu 平台上的实现 引言 opencl在amd phenom ii x上的 实现 opencl在amd radeon hd gpu上的实现 多线程和内存系统 基于clause的simd执行 资源分配 opencl的内存性能 opencl全局内存 本地内存——软件管理的cache 小结 参考文献 第七章 opencl案例学习:卷积 引言 计算卷积的kernel 选择合适的workgroup大小 将数据缓存到本地内存 执行卷积 小结 代码清单 主机端代码 kernel代码 参考文献 第八章 opencl案例学习: 视频处理 引言 获得视频帧 cpu上的解码 在gpu上解码视频 在opencl中处理一个视频 在多个视频上处理多个不同effect 事件链 最终输出显示到屏幕 opencl/opengl协同工作能力 小结 第九章 opencl案例学习:直方图 引言 选择适量的work-group 选择最优的work-group大小 全局内存访存优化 使用原子操作计算局部直方图 本地内存访存优化 局部直方图的规约 全局规约 完整的kernel代码 性能和小结 第十章 opencl案例学习: 混合粒子模拟 引言 计算概览 gpu实现 创建buffer 构造加速结构 计算碰撞 合成 cpu实现 负载均衡 性能和小结 生成均匀网格的kernel代码 粒子模拟的kernel代码 第十一章 opencl扩展 引言 扩展机制概览 设备拆分 双精度 参考文献 第十二章 opencl的性能剖析和 调试 引言 基于事件的剖析 amd app profiler 收集opencl程序轨迹 收集opencl gpu kernel性能 计数器 amd app kernelanalyzer 演示amd app profiler 启动amd app profiler 使用应用程序的轨迹数据 以发现性能瓶颈 使用gpu性能计数器发现kernel的 性能瓶颈 调试opencl应用程序 gdebugger概览 使用gdebugger调试并行opencl 应用程序 amd printf扩展 小结 第十三章 webcl 引言 框架设计 webcl 实验性实现 firefox扩展 连接javascript和opencl webcl动手练习 web照片编辑器 讨论 小结 参考文献 扩展阅读和相关网站 索引 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。