![]()
内容推荐 显著性物体检测(Salient Object Detection, SOD)技术以人类视觉认知机制为基础,模拟人类视觉系统的注意力机制。该技术涉及计算机视觉、机器学习、认知心理学、脑科学等多个学科,是典型的交叉学科技术,在现实生活中有着广泛的应用基础。 本书从数据采集、模型构建和评价标准设计三个方面对SOD技术展开了系统的研究,包括开放环境下的图像SOD技术、动态场景下的SOD视觉转移建模技术以及符合人类认知规律的评价指标设计。 本书可以作为高等院校计算机视觉及模式识别相关专业的本科生、研究生,以及计算机相关领域科研工作者的参考书。 作者简介 范登平,苏黎世联邦理工学院博士后研究员,曾任阿联酋起源人工智能研究院(IIAI)研究员、阿里巴巴达摩院高级算法工程师。长期从事计算机视觉领域中基础理论和应用的研究,在认知规律启发的视觉场景理解和评价准则方面取得了重要突破。在国内外权威期刊和会议上发表CCF A类论文近40篇(含6篇/EEE TPAM/论文),连续两年入选CVPR Best Paper Finalists,荣获首届计图开发者大会杰出论文奖和最具影响力(应用)论文奖,连续两次入选由美国斯坦福大学公布的全球前2%顶尖科学家榜单(2021年、2022年)。“伪装目标检测”任务被英国权威杂志New Scientist撰文报道,获中国专利6项、美国专利3项。担任中国计算机学会计算机视觉专业委员会委员、IEEE高级会员、CVPR 2023领域主席、第七届MICCAI眼科医学影像分析研讨会领域主席,担任国际期刊Computer Vision and Machine Learning的编委,长期担任IEEETPAMI、IEEE TIP、IEEE TMI/等20余种知名刊物的评审员。 目录 丛书序 推荐序Ⅰ 推荐序Ⅱ 导师序 摘要 ABSTRACT 第1章 绪论 1.1 本书背景 1.1.1 研究背景 1.1.2 国内外研究现状 1.1.3 开放性评测数据集及智能检测模型 1.1.4 综合评价体系 1.2 研究目标与主要贡献 1.3 本书的组织结构 第2章 相关工作 2.1 图像显著性物体检测 2.1.1 图像显著性物体检测数据集 2.1.2 基于深度学习的图像显著性物体检测模型 2.2 视频显著性物体检测 2.2.1 视频显著性物体检测数据集 2.2.2 视频显著性物体检测模型 2.3 非二进制显著性物体检测评价指标 2.3.1 二值显著图的评估 2.3.2 非二值显著图的评估 2.3.3 当前指标的局限性 2.4 二进制显著性物体检测评价指标 第3章 富上下文环境下的显著性物体检测数据集与评测 3.1 引言 3.1.1 背景知识 3.1.2 研究动机 3.1.3 解决方案概要 3.2 SOC数据集 3.2.1 存在非显著物体 3.2.2 图像的数量和类别 3.2.3 显著物体的全局/局部颜色对比 3.2.4 显著物体的位置 3.2.5 显著物体的大小 3.2.6 高质量的显著对象标签 3.2.7 具有属性的显著对象 3.3 基于深度学习的显著性检测模型评测结果 3.3.1 评估指标 3.3.2 指标统计 3.3.3 基于属性的评估 3.4 讨论和结论 第4章 基于注意力转移机制的视频显著性物体检测 4.1 引言 4.1.1 背景知识 4.1.2 研究动机 4.1.3 解决方案概要 4.2 DAVSOD数据集 4.2.1 视频采集 4.2.2 数据标注 4.2.3 数据集的特点与统计 4.2.4 数据集划分 4.3 SSAV模型 4.3.1 基于显著性转移的视频显著性物体检测模型 4.3.2 实现细节 4.4 视频显著性物体检测模型评测结果 4.4.1 实验设置 4.4.2 性能比较和数据集分析 4.4.3 分离实验 4.5 讨论和结论 第5章 基于结构相似性的显著性检测评价指标 5.1 引言 5.1.1 背景知识 5.1.2 研究动机 5.1.3 解决方案概要 5.2 S-measure指标 5.2.1 面向区域的结构相似性度量 5.2.2 面向物体的结构相似性度量 5.2.3 结构相似性指标 5.3 实验验证 5.3.1 元度量1:应用排序 5.3.2 元度量2:新水平vs.通用映射图 5.3.3 元度量3:标准显著图替换 5.3.4 元度量4:标注错误 5.3.5 进一步比较 5.3.6 元度量5:人的判别 5.3.7 显著性模型比较 5.4 讨论和结论 第6章 基于局部和全局匹配的显著性物体检测评价指标 6.1 引言 6.1.1 背景知识 6.1.2 研究动机 6.1.3 解决方案概要 6.2 E-measure指标 6.2.1 局部项 6.2.2 局部全局匹配项 6.2.3 局部全局匹配指标 6.3 实验验证 6.3.1 元度量 6.3.2 数据集和模型 6.3.3 元度量1:应用排序 6.3.4 元度量2:先进vs.通用映射图 6.3.5 元度量3:先进vs.随机噪声 6.3.6 元度量4:人为排序 6.3.7 元度量5:手工标注图替换 6.4 讨论和结论 第7章 总结与展望 7.1 工作总结 7.2 展望 参考文献 致谢 在学期间的学术论文与研究成果 丛书跋 |