![]()
内容推荐 “人工智能超入门丛书”致力于面向人工智能各技术方向零基础的读者,内容涉及数据思维、机器学习、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,体系完整、内容简洁、文字通俗,综合介绍人工智能相关知识,并辅以程序代码解决问题,使得零基础的读者快速入门。 《视觉感知:深度学习如何知图辨物》是“人工智能超入门丛书”中的分册,本分册主要介绍人工智能视觉领域的相关知识,以通俗易懂的文字风格,解读用卷积神经网络等深度学习算法及机器学习算法对图像进行分类和识别的方法,介绍OpenCV在图像处理中的基础知识,为进一步学习高阶内容奠定基础。同时,本书配有关键代码,让读者在学习过程中快速上手,提升解决问题的能力。 本书可以作为大学生以及想要走向计算机视觉相关工作岗位的技术人员的入门读物,同时,对人工智能感兴趣的人群也可以阅读。 作者简介 龚超,日本工学博士,清华大学日本研究中心主任助理,深圳清华大学研究院下一代互联网研发中心核心成员,未来基因(北京)人工智能研究院首席专家,教育部教育信息化教学应用实践共同体项目特聘专家。中国人工智能学会中小学工作委员会委员,中国自动化学会普及工作委员会委员。研究方向为人工智能优化算法,人工智能在数字化转型中的应用等。多家500强企业数字化转型领域高级顾问,在国内外期刊上发表文章共计60余篇。 目录 第1章 计算机视觉综述 1.1 生物的视界 1.1.1 三只眼 1.1.2 眼见为实? 1.2 人工智能的视界 1.2.1 数字图像类型 1.2.2 从图像到矩阵 1.2.3 视不同,理相通 1.3 计算机视觉发展与应用 1.3.1 计算机视觉发展史 1.3.2 大规模视觉识别挑战赛 1.3.3 计算机视觉应用 第2章 机器学习与图像识别 2.1 从感知机到支持向量机 2.1.1 感知机的线性可分 2.1.2 支持向量机 2.2 支持向量机的超强“核”心 2.3 支持向量机的实践 2.3.1 鸢尾花的辨识 2.3.2 手写数字图像识别 第3章 神经网络与图像分类 3.1 从神经元到神经网络 3.1.1 神经元与感知机 3.1.2 神经网络的结构 3.1.3 前向与反向传播 3.2 激活函数与损失函数 3.2.1 非线性转换的激活函数 3.2.2 衡量优劣的损失函数 3.2.3 激活函数与损失函数的组合 3.3 拟合与误差 3.3.1 过拟合与欠拟合 3.3.2 偏差与方差的权衡 3.4 利用神经网络识别手写数字图像 3.4.1 MNIST手写数字图像数据集 3.4.2 Scikit-learn库神经网络与手写数字图像 3.4.3 NumPy库神经网络与手写数据集 第4章 卷积入门 4.1 图像噪声 4.2 卷积核与去噪 4.3 边缘检测 4.4 纹理分析 第5章 卷积神经网络及经典详解 5.1 卷积神经网络的提出 5.1.1 从全局到局部 5.1.2 感受野 5.2 卷积层、池化层与全连接层 5.2.1 卷积与卷积层 5.2.2 池化与池化层 5.2.3 全连接层 5.3 卷积神经网络的图像分类 5.3.1 CIFAR-10图像集介绍 5.3.2 简单实现图像分类 5.4 ImageNet与经典网络介绍 5.4.1 ImageNet数据集 5.4.2 经典卷积神经网络 第6章 OpenCV基础 6.1 图像处理入门 6.1.1 读取、显示与保存图像 6.1.2 分割与合并颜色通道 6.1.3 转换颜色空间 6.1.4 读取、显示与保存视频 6.2 图像基本变换 6.2.1 操作单个像素 6.2.2 裁剪图像 6.2.3 调整图像大小 6.2.4 翻转图像 6.3 为图像添加注释 6.3.1 为图像添加线段 6.3.2 为图像添加圆 6.3.3 为图像添加矩形 6.3.4 为图像添加文本 6.4 图像增强 6.4.1 调整图像亮度 6.4.2 调整图像对比度 第7章 OpenCV实战应用 7.1 目标跟踪 7.1.1 目标跟踪算法 7.1.2 创建跟踪器实例 7.2 目标检测 7.2.1 SSD目标检测算法 7.2.2 目标检测实例 7.3 图像分割 7.3.1 图像分割介绍 7.3.2 通过Mask R-CNN进行图像分割 7.4 人脸识别 7.4.1 人脸检测实例 7.4.2 眼睛检测实例 附录 附录一 优化基础 附录二 神经网络代码 附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 序言 新一代人工智能的崛起 深刻影响着国际竞争格局, 人工智能已经成为推动国家 与人类社会发展的重大引擎 。2017年,国务院发布《 新一代人工智能发展规划》 ,其中明确指出:支持开展 形式多样的人工智能科普活 动,鼓励广大科技工作者投 身人工智能知识的普及与推 广,全面提高全社会对人工 智能的整体认知和应用水平 。实施全民智能教育项目, 在中小学阶段设置人工智能 相关课程,逐步推广编程教 育,鼓励社会力量参与寓教 于乐的编程教学软件、游戏 的开发和推广。 为了贯彻落实《新一代 人工智能发展规划》,国家 有关部委相继颁布出台了一 系列政策。截至2022年2月 ,全国共有440所高校设置 了人工智能本科专业,387 所普通高等学校高等职业教 育(专科)设置了人工智能 技术服务专业,一些高校甚 至已经在积极探索人工智能 跨学科的建设。在高中阶段 ,“人工智能初步”已经成为 信息技术课程的选择性必修 内容之一。在2022年实现“ 从0到1”突破的义务教育阶 段信息科技课程标准中,明 确要求在7~9年级需要学习 “人工智能与智慧社会”相关 内容,实际上,1~6年级阶 段的不少内容也与人工智能 关系密切,是学习人工智能 的基础。 人工智能是一门具有高 度交叉属性的学科,笔者认 为其交叉性至少体现在三个 方面:行业交叉、学科交叉 、学派交叉。在大数据、算 法、算力三驾马车的推动下 ,新一代人工智能已经逐步 开始赋能各个行业,现在几 乎没有哪一个行业不涉及人 工智能有关元素。人工智能 也在助力各学科的研究,近 几年,《自然》等顶级刊物 不断刊发人工智能赋能学科 的文章,如人工智能推动数 学、化学、生物、考古、设 计、音乐以及美术等。人工 智能内部的学派也在不断交 叉融合,像知名的AlphaGo ,就是集三大主流学派优势 制作,并且现在这种不同学 派间取长补短的研究开展得 如火如荼。总之,未来的学 习、工作与生活中,人工智 能赋能的身影将无处不在, 因此掌握一定的人工智能知 识与技能将大有裨益。 根据笔者长期从事人工 智能教学、研究经验来看, 一些人对人工智能还存在一 定的误区。比如将编程与人 工智能直接画上了等号,又 或是认为人工智能就只有深 度学习等。实际上,人工智 能的知识体系十分庞大,内 容涵盖相当广泛,不但有逻 辑推理、知识工程、搜索算 法等相关内容,还涉及机器 学习、深度学习以及强化学 习等算法模型。当然,了解 人工智能的起源与发展、人 工智能的道德伦理对正确认 识人工智能和树立正确的价 值观也是十分必要的。 通过对人工智能及其相 关知识的系统学习,可以培 养数学思维(Mathematical Thinking)、逻辑思维 (Reasoning Thinking)、 计算思维(Computational Thinking)、艺术思维 (Artistic Thinking)、创新 思维(Innovative Thinking )与数据思维(Data Thinking),即MRCAID。 然而遗憾的是,目前市场上 既能较综合介绍人工智能相 关知识,又能辅以程序代码 解决问题,同时还能迅速入 门的图书并不多见。因此笔 者策划了本系列图书,以期 实现体系内容较全、配合程 序操练及上手简单方便等特 点。 本书主要介绍一些关于 人工智能视觉领域相关的知 识。除介绍像卷积神经网络 等深度学习算法解决图像分 类问题外,也给出了如何利 用传统机器学习算法进行图 像识别的知识与技能。本书 也介绍了OpenCV在图像处 理中的一些基础知识,为进 一步学习高阶的内容奠定了 基础。第1章介绍了计算机 视觉的基础知识与发展脉络 ,第2章介绍如何利用支持 向量机解决分类问题以及其 在手写数字图像识别中的运 用,第3章介绍神经网络实 现对MNIST手写数字数据集 的分类,第4章和第5章介绍 卷积神经网络的相关知识以 及其实现图像分类的案例, 第6章主要介绍OpenCV的基 础知识,第7章在第6章的基 础上,介绍了目标跟踪、目 标检测、图像分割以及人脸 识别等相关知识。本书的附 录部分介绍了关于优化问题 的基础知识以及给出了一步 步实现神经网络的代码。 本书的出版要感谢曾提 供热情指导与帮助的院士、 教授、中小学教师等专家学 者,也要感谢与笔者一起并 肩参与写作的其他作者,同 时还要感谢化学工业出版社 编辑老师们的热情支持与一 丝不苟的工作态度。 在本书的出版过程中, 未来基因(北京)人工智能 研究院、腾讯教育、阿里云 、科大讯飞等机构给予了大 力支持,在此一并表示感谢 。同时,本书受“中央高校 基本科研业务费专项资金” 资助,在此表示感谢。 由于笔者水平有限,书 中内容不可避免会存在疏漏 ,欢迎广大读者批评指正并 提出宝贵的意见。 龚超 2022年9月于清华大学 |