内容推荐 本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。 目录 第1章 Python基础 1.1 实践一:九九乘法表 1.2 实践二:随机数生成与排序 1.3 实践三:批量文件遍历、复制、重命名 1.4 实践四:图像直方图统计 1.5 实践五:数据统计分析及可视化 1.6 实践六:图像预处理 第2章 图像分类 2.1 实践一:基于深度神经网络的宝石分类 2.2 实践二:基于卷积神经网络的美食识别 2.3 实践三:基于VGG系列网络的场景图像分类 2.4 实践四:基于ResNet系列模型的车辆图像分类实践 2.5 实践五:基于Vision Transformer的CIFAR10分类 第3章 目标检测 3.1 实践一:基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测) 3.2 实践二:基于YOLOV3/PP-YOLO模型的昆虫检测(一阶段目标检测) 3.3 实践三:基于DETR模型的目标检测 第4章 图像分割 4.1 实践一:基于U-Net/DeepLab V3 Plus模型的宠物图像分割 4.2 实践二:基于PaddleSeg的人像视频分割 4.3 实践三:基于PSPNet模型的人体图像分割 4.4 实践四:基于Swin-UNet模型的医学图像分割 第5章 视频分类 5.1 实践一:基于TSN模型的视频分类 5.2 实践二:基于ECO模型的视频分类 5.3 实践三:基于TimeSformer模型的视频分类 第6章 图像生成 6.1 实践一:基于GAN模型的时尚衣服生成 6.2 实践二:基于PaddleGAN的图像超分辨率 6.3 实践三:基于DcGAN模型的人脸图像生成 6.4 实践四:基于Pix2Pix模型的图像翻译 6.5 实践五:基于cycleGAN模型的图像风格迁移 参考文献 |