![]()
内容推荐 随着通用处理器性能增长的减缓及基于神经网络的智能应用的不断涌现,神经网络加速器正逐步成为新型计算系统中不可或缺的部分。过去几年,学术界乃至工业界出现了大量的神经网络加速器芯片。针对过去的神经网络加速器设计在计算模式、计算架构和存储优化方面存在的不足,本书的研究总结出两套神经网络加速器的优化设计方法:基于“计算模式-动态重构”的计算架构设计方法和基于“器件特性-容错能力”的存储优化方法。主要介绍三项基于上述优化设计方法的研究工作,即面向通用神经网络近似的神经网络计算架构RNA、面向专用人工智能领域的神经网络计算架构DNA和基于数据保持时间的神经网络存储优化框架RANA。 本书可供从事神经网络加速器、专用领域计算、可重构计算研究的高校师生和科研院所研究人员及相关技术人员阅读参考。 目录 第1章 绪论 1.1 研究背景 1.2 研究现状 1.2.1 神经网络算法的发展历程 1.2.2 神经网络加速器的研究现状 1.3 研究动机 1.4 研究思路与研究内容 1.4.1 研究思路 1.4.2 研究内容 第2章 面向通用神经网络近似的神经网络计算架构RNA 2.1 引言 2.2 问题背景 2.2.1 神经网络近似与加速 2.2.2 通用架构模型 2.3 计算模式 2.3.1 RNA架构概览 2.3.2 FP计算模式 2.3.3 NE计算模式 2.3.4 CE计算模式 2.3.5 调度框架 2.4 RNA架构设计 2.4.1 RNA架构的PE设计 2.4.2 RNA架构的互连设计 2.4.3 RNA架构的控制器设计 2.5 实验结果 2.5.1 实验设置 2.5.2 RNA架构的版图和硬件指标 2.5.3 RNA架构的性能分析 2.5.4 RNA架构的参数探索 2.6 小结 第3章 面向专用人工智能领域的神经网络计算架构DNA 3.1 引言 3.2 问题背景 3.2.1 CNN模型 3.2.2 以CNN加速器为中心的计算系统架构 3.2.3 CNN加速的两大执行目标和挑战 3.3 计算模式 3.3.1 计算模式概览 3.3.2 数据复用模式 3.3.3 卷积映射方法 3.3.4 对全连接层的支持 3.4 DNA架构设计 3.4.1 可重构数据通路设计 3.4.2 可重构卷积引擎设计 3.4.3 DNA架构的工作流程和调度框架 3.5 实验结果 3.5.1 实验设置 3.5.2 DNA架构的版图和硬件指标 3.5.3 DNA架构的访存和整体能耗分析 3.5.4 DNA架构的性能分析 3.5.5 DNA架构与国际顶尖工作的比较 3.5.6 基于DNA架构的人工智能计算芯片Thinker 3.6 小结 第4章 基于数据保持时间的神经网络存储优化框架RANA 4.1 引言 4.2 问题背景 4.2.1 CNN模型 4.2.2 CNN加速器 4.2.3 CNN加速器的缓存容量问题 4.2.4 eDRAM及数据保持问题 4.3 研究动机 4.3.1 实验平台 4.3.2 问题分析 4.3.3 优化机会 4.4 RANA框架 4.4.1 RANA框架概览 4.4.2 基于数据保持时间的训练方法 4.4.3 混合计算模式 4.4.4 刷新优化的eDRAM控制器 4.5 实验结果 4.5.1 实验设置 4.5.2 对RANA框架的评估 4.5.3 在DaDianNao上的扩展性分析 4.6 小结 第5章 总结与展望 5.1 工作总结 5.2 未来工作展望 参考文献 在学期间发表的学术论文与研究成果 致谢 |