![]()
内容推荐 本书为1+X职业技能等级证书配套系列教材之一,以《计算机视觉应用开发职业技能等级标准(中级)》为依据,由北京百度网讯科技有限公司组织编写。 本书分为视觉数据处理进阶、深度学习模型训练与应用、视觉类应用开发、视觉模型应用与部署4部分,共11个项目。具体内容包括图像分割、图像匹配、视频预处理、手势识别、车牌识别、口罩识别、OCR文字识别、图像搜索、人脸识别、Web端部署推理及端侧部署推理。全书以“项目-任务”方式安排教学内容,并采用模块化的组织形式,便于教师课堂的教学实施,以及学生由浅入深地学习各相关知识点。 本书配套微课视频、电子课件(PPT)、案例源码等数字化学习资源。与本书配套的数字课程“计算机视觉应用开发”在“智慧职教”平台(www.icve.com.cn)上线,学习者可以登录平台进行学习,也可以通过扫描书中二维码观看教学视频,详见“智慧职教”服务指南。教师可发邮件至编辑邮箱1548103297@qq.com获取相关教学资源。 本书可作为计算机视觉应用开发1+X职业技能等级证书(中级)认证的相关教学和培训教材,也可作为人工智能应用领域相关技术人员的自学参考书。 目录 第1部分 视觉数据处理进阶 项目1 图像分割 学习情境 学习目标 相关知识 1.1 图像平滑滤波与边缘检测 1.2 阈值处理与查找轮廓 1.3 图像的形态学处理 项目任务 任务1-1 提取显示数字的液晶屏部分 任务1-2 获取每个数字的区域 任务1-3 识别每个数字 项目总结 项目2 图像匹配 学习情境 学习目标 相关知识 2.1 图像金字塔 2.2 图像特征检测与提取 2.3 图像特征暴力匹配 项目任务 任务2-1 查找特征点 任务2-2 完成匹配和校验 项目总结 项目3 视频预处理 学习情境 学习目标 相关知识 3.1 从摄像头读取视频帧 3.2 读取视频文件中的帧序列 3.3 转换帧序列为视频文件 3.4 视频帧预处理 项目任务 任务3-1 整理文件目录,显示视频内容 任务3-2 完成分帧操作 项目总结 第2部分 深度学习模型训练与应用 项目4 手势识别 学习情境 学习目标 相关知识 4.1 机器学习概述 4.2 深度学习概述 4.3 深度学习框架和平台 4.4 PaddlePaddle深度学习的基本用法 项目任务 任务4-1 准备数据 任务4-2 配置和训练网络模型 任务4-3 模型评估和推理 项目总结 项目5 车牌识别 学习情境 学习目标 相关知识 5.1 卷积神经网络 5.2 PaddlePaddle搭建卷积网络结构 项目任务 任务5-1 准备数据 任务5-2 配置和训练网络模型 任务5-3 模型评估和预测 项目总结 项目6 口罩识别 学习情境 学习目标 相关知识 6.1 迁移学习简介 6.2 用VGG模型做迁移学习 6.3 PaddlePaddle构建VGG模型 6.4 数据提供器 项目任务 任务6-1 准备数据 任务6-2 迁移学习构建模型 任务6-3 模型训练 任务6-4 模型检验和推理 项目总结 第3部分 视觉类应用开发 项目7 文字识别 学习情境 学习目标 相关知识 7.1 OCR的基本概念 7.2 OCR的类别 7.3 OCR的技术路线 7.4 相关API 项目任务 任务7-1 提取银行卡图片 任务7-2 通过百度OCR识别银行卡字段 项目总结 项目8 图像搜索 学习情境 学习目标 相关知识 8.1 商品图片搜索服务的功能 8.2 商品图片搜索服务的应用场景 8.3 商品图片搜索服务的相关API 项目任务 任务8-1 图片库管理 任务8-2 商品搜索 项目总结 项目9 人脸识别 学习情境 学习目标 相关知识 9.1 人脸识别服务功能 9.2 百度人脸识别API 项目任务 任务9-1 建立人脸库 任务9-2 进行人脸匹配 项目总结 第4部分 视觉模型应用与部署 项目10 Web端部署推理 学习情境 学习目标 相关知识 10.1 Web基础 10.2 使用Flask框架 项目任务 任务10-1 使用Flask框架开发Web应用 任务10-2 模型应用部署 项目总结 项目11 端侧部署推理 学习情境 学习目标 相关知识 11.1 芝云协同 11.2 AI的端侧部署 项目任务 任务11-1 模型转换 任务11-2 端侧推理 项目总结 参考文献 |