内容推荐 《基于深度学习的图像处理与实践》循序渐进、深入浅出地讲解了基于深度学习的图像处理的核心知识,并通过具体实例演示了开发深度学习图像处理程序的方法和流程。全书共14章,分别讲解了图像识别技术基础,scikit-image数字图像处理,OpenCV图像视觉处理,dlib机器学习和图像处理,face_recognition人脸识别,采样、变换和卷积处理,图像增强,图像特征提取,图像分割,目标检测,图像分类,国内常用的第三方人脸识别平台,斗转星移换图系统,智能OCR文本检测识别系统等内容。本书语言简洁而不失技术深度,内容全面。 《基于深度学习的图像处理与实践》适用于已经了解了Python语言基础语法,想进一步学习机器学习、深度学习、计算机视觉与图像处理技术的读者,还可以作为大专院校相关专业的师生用书和培训机构的专业性教材。 目录 第1章 图像识别技术基础 1 1.1 图像识别概述 2 1.1.1 什么是图像识别 2 1.1.2 图像识别的发展阶段 2 1.1.3 图像识别的应用 3 1.2 图像识别的过程 4 1.3 图像识别技术 4 1.3.1 人工智能 5 1.3.2 机器学习 5 1.3.3 深度学习 6 1.3.4 基于神经网络的图像识别 6 1.3.5 基于非线性降维的图像识别 7 第2章 scikit-image数字图像处理 9 2.1 scikit-image基础 10 2.1.1 安装scikit-image 10 2.1.2 scikit-image中的模块 10 2.2 显示图像 11 2.2.1 使用skimage读入并显示外部图像 11 2.2.2 读取并显示外部灰度图像 12 2.2.3 读取并显示内置星空图片 13 2.2.4 读取并保存内置星空图片 14 2.3 常见的图像操作 14 2.3.1 对内置图片进行二值化操作 15 2.3.2 对内置图片进行裁剪处理 16 2.3.3 将RGB图转换为灰度图 17 2.3.4 使用skimage实现绘制图片功能 18 2.3.5 使用subplot()函数绘制多视图窗口 19 2.3.6 改变指定图片的大小 21 2.3.7 使用函数rescale()缩放图片 22 2.3.8 使用函数rotate()旋转图片 22 第3章 OpenCV图像视觉处理 25 3.1 OpenCV基础 26 3.1.1 OpenCV和OpenCV-Python介绍 26 3.1.2 安装OpenCV-Python 26 3.2 OpenCV-Python图像操作 27 3.2.1 读取并显示图像 27 3.2.2 保存图像 29 3.2.3 在Matplotlib中显示图像 30 3.2.4 绘图 31 3.2.5 将鼠标作为画笔 34 3.2.6 调色板程序 36 3.2.7 基本的属性操作 37 3.3 OpenCV-Python视频操作 40 3.3.1 读取视频 40 3.3.2 播放视频 41 3.3.3 保存视频 42 3.3.4 改变颜色空间 43 3.3.5 视频的背景分离 45 第4章 dlib机器学习和图像处理 49 4.1 dlib介绍 50 4.2 dlib基本的人脸检测 50 4.2.1 人脸检测 50 4.2.2 使用命令行进行人脸识别 52 4.2.3 检测人脸关键点 54 4.2.4 基于CNN的人脸检测器 56 4.2.5 在摄像头中识别人脸 58 4.2.6 人脸识别验证 59 4.2.7 全局优化 60 4.2.8 人脸聚类 62 4.2.9 抖动采样和增强 64 4.2.10 人脸和姿势采集 65 4.2.11 物体追踪 66 4.3 SVM分类算法 67 4.3.1 二进制SVM分类器 68 4.3.2 Ranking SVM算法 69 4.3.3 Struct SVM多分类器 72 4.4 自训练模型 75 4.4.1 训练自己的模型 75 4.4.2 自制对象检测器 78 第5章 face_recognition人脸识别 83 5.1 安装face_recognition 84 5.2 实现基本的人脸检测 84 5.2.1 输出显示指定人像人脸特征 84 5.2.2 在指定照片中识别标记出人脸 86 5.2.3 识别出照片中的所有人脸 88 5.2.4 判断照片中是否包含某个人 91 5.2.5 识别出照片中的人是谁 92 5.2.6 摄像头实时识别 93 5.3 深入face_recognition人脸检测 98 5.3.1 检测用户眼睛的状态 99 5.3.2 模糊处理人脸 101 5.3.3 检测两个人脸是否匹配 102 5.3.4 识别视频中的人脸 103 5.3.5 网页版人脸识别器 106 第6章 采样、变换和卷积处理 109 6.1 采样 110 6.1.1 最近邻插值采样 110 6.1.2 双线性插值 112 6.1.3 双立方插值 116 6.1.4 Lanczos插值 118 6.2 离散傅里叶变换 119 6.2.1 为什么使用DFT 119 6.2.2 用库NumPy实现DFT 120 6.2.3 用库SciPy实现DFT 121 6.2.4 用快速傅里叶变换算法计算DFT 122 6.3 卷积 124 6.3.1 为什么需要卷积图像 124 6.3.2 使用库SciPy中的函数 convolve2d()进行卷积 124 6.3.3 使用库SciPy中的函数ndimage.convolve()进行卷积 126 6.4 频域滤波 128 6.4.1 什么是滤波器 128 6.4.2 高通滤波器 128 6.4.3 低通滤波器 130 6.4.4 DoG 带通滤波器 130 6.4.5 带阻滤波器 132 第7章 图像增强 135 7.1 对比度增强 136 7.1.1 直方图均衡化 136 7.1.2 自适应直方图均衡化 138 7.1.3 对比度拉伸 140 7.1.4 非线性对比度增强 142 7.2 锐化 144 7.2.1 锐化滤波 145 7.2.2 高频强调滤波 148 7.2.3 基于梯度的锐化 152 7.3 减少噪声 156 7.3.1 均值滤波器 156 7.3.2 中值滤波器 158 7.3.3 高斯滤波器 158 7.3.4 双边滤波器 159 7.3.5 小波降噪 160 7.4 色彩平衡 161 7.4.1 白平衡 161 7.4.2 颜色校正 163 7.4.3 调整色调和饱和度 164 7.5 超分辨率 165 7.6 去除运动模糊 167 7.6.1 边缘 167 7.6.2 逆滤波 169 7.6.3 统计方法 170 7.6.4 盲去卷积 171 第8章 图像特征提取 173 8.1 图像特征提取方法 174 8.2 颜色特征 174 8.2.1 颜色直方图 174 8.2.2 其他颜色特征提取方法 176 8.3 纹理特征 178 8.3.1 灰度共生矩阵 178 8.3.2 方向梯度直方图 180 8.3.3 尺度不变特征变换 181 8.3.4 小波变换 182 8.4 形状特征 184 8.4.1 边界描述子 184 8.4.2 预处理后的轮廓特征 188 8.4.3 模型拟合方法 190 8.4.4 形状上的变换 193 8.5 基于LoG、DoG和DoH的斑点检测器 196 8.5.1 LoG滤波器 197 8.5.2 DoG滤波器 198 8.5.3 DoH算法 200 第9章 图像分割 203 9.1 图像分割的重要性 204 9.2 基于阈值的分割 204 9.2.1 灰度阈值分割 205 9.2.2 彩色阈值分割 206 9.3 基于边缘的分割 207 9.3.1 Canny边缘检测 207 9.3.2 边缘连接方法 208 9.4 基于区域的分割 209 9.4.1 区域生长算法 209 9.4.2 图割算法 212 9.4.3 基于聚类的分割算法 213 9.5 基于图论的分割 215 9.5.1 图割算法 215 9.5.2 最小生成树算法 215 9.6 基于深度学习的分割 217 9.6.1 FCN 217 9.6.2 U-Net 219 9.6.3 DeepLab 220 9.6.4 Mask R-CNN 220 第10章 目标检测 223 10.1 目标检测概述 224 10.1.1 目标检测的步骤 224 10.1.2 目标检测的方法 224 10.2 YOLO v5 225 10.2.1 YOLO v5的改进 225 10.2.2 基于YOLO v5的训练、验证和预测 226 10.3 语义分割 242 10.3.1 什么是语义分割 242 10.3.2 DeepLab语义分割 244 10.4 SSD目标检测 245 10.4.1 摄像头目标检测 246 10.4.2 基于图像的目标检测 247 第11章 图像分类 249 11.1 图像分类介绍 250 11.2 基于特征提取和机器学习的图像分类 250 11.2.1 图像分类的基本流程 250 11.2.2 基于scikit-learn机器学习的图像分类 251 11.2.3 分类算法 254 11.2.4 聚类算法 257 11.3 基于卷积神经网络的图像分类 259 11.3.1 卷积神经网络的基本结构 259 11.3.2 第一个卷积神经网络程序 262 11.3.3 使用卷积神经网络进行图像分类 267 11.4 基于迁移学习的图像分类 279 11.4.1 迁移学习介绍 279 11.4.2 基于迁移学习的图片分类器 280 11.5 基于循环神经网络的图像分类 284 11.5.1 循环神经网络介绍 284 11.5.2 实战演练 285 11.6 基于卷积循环神经网络的图像分类 286 11.6.1 卷积循环神经网络介绍 286 11.6.2 CRNN图像识别器 287 第12章 国内常用的第三方人脸识别平台 291 12.1 百度AI开放平台 292 12.1.1 百度AI开放平台介绍 292 12.1.2 使用百度AI之前的准备工作 292 12.1.3 基于百度AI平台的人脸识别 296 12.2 科大讯飞AI开放平台 301 12.2.1 科大讯飞AI开放平台介绍 301 12.2.2 申请试用 301 12.2.3 基于科大讯飞AI的人脸识别 302 第13章 斗转星移换图系统 311 13.1 背景介绍 312 13.1.1 CycleGAN的作用 312 13.1.2 CycleGAN的原理 312 13.2 系统模块架构 313 13.3 设置数据集 313 13.4 训练数据 315 13.4.1 加载图像 315 13.4.2 辅助功能 316 13.4.3 生成对抗网络模型 319 13.4.4 训练CycleGAN模型 322 13.5 图像转换 326 13.6 调试运行 328 第14章 智能OCR文本检测识别系统 333 14.1 OCR系统介绍 334 14.1.1 OCR的基本原理和方式 334 14.1.2 深度学习对OCR的影响 335 14.1.3 与OCR相关的深度学习技术 335 14.2 OCR项目介绍 336 14.3 准备模型 337 14.3.1 文本检测模型 337 14.3.2 文本识别模型 337 14.4 创建工程 337 14.4.1 工程配置 338 14.4.2 配置应用程序 338 14.4.3 导入模型 338 14.5 具体实现 339 14.5.1 页面布局 339 14.5.2 实现主Activity 339 14.5.3 图像操作 343 14.5.4 运行OCR模型 347 14.6 调试运行 354 |