内容推荐 本书属于工业和信息化部“十四五”规划教材。全书以数据标注对人工智能技术与应用的重要意义为出发点,梳理了数据标注从小规模、自给自足模式向大规模、职业化标注模式的发展脉络,深入介绍了当前以众包和数据标注工厂为代表的标注模式所呈现的“群智化”关键特征,并结合不同类型的数据以及典型应用场景,系统介绍了数据标注的基本概念、关键技术、支撑工具和系统平台,以及标注过程的组织和管理方法等。第1~4章详细介绍数据标注的基础概念、技术及系统等;第5~8章分别介绍文本、音频、图像和视频四类数据的标注技术;第9、第10两章以自动驾驶数据标注、人脸与人体数据标注的真实场景为出发点,从实操的角度分别阐述自动驾驶场景、人脸与人体数据标注实践过程;第11章展望数据标注技术的未来发展。 本书以培养人工智能应用所急需的数据标注人才为目标,可供高职、大专院校人工智能和大数据等相关专业师生使用,也可供从事数据标注职业的技术人员以及人工智能技术实践者参考阅读。 目录 第1章 人工智能与数据标注 1.1 人工智能基础 1.1.1 人工智能概述 1.1.2 人工智能发展简史 1.1.3 人工智能主要研究内容与热点 1.1.4 人工智能的应用场景 1.1.5 人工智能的发展前景 1.2 数据——人工智能的重要基石 1.2.1 数据是人工智能行业的“石油” 1.2.2 数据的定义与来源 1.2.3 标注数据是机器学习的重要基础工作 1.3 数据标注的概念与现状 1.3.1 数据标注的概念 1.3.2 数据标注应用与发展现状 1.4 数据标注的主要发展脉络 1.4.1 小规模专家标注 1.4.2 群智化标注 1.5 本章小结 1.6 作业与练习 第2章 群智化数据标注技术与系统 2.1 数据标注的基本方法 2.1.1 人工标注 2.1.2 自动化标注 2.1.3 人机协同标注 2.2 常见数据标注任务及工具 2.2.1 文本数据标注 2.2.2 音频数据标注 2.2.3 图像数据标注 2.2.4 视频数据标注 2.2.5 面向特定场景的综合数据标沣 2.3 群智化数据标注技术 2.3.1 群智化数据标注的产生背景 2.3.2 群智化数据标注面临的挑战与应对方法 2.4 群智化数据标注平台 2.4.1 群智化数据标注平台产生背景 2.4.2 群智化数据标注平台现状 2.4.3 群智化数据标注平台的主要功能 2.4.4 群智化数据标注平台架构概述 2.5 群智化数据标注平台实例 2.5.1 众包平台——亚马逊MTurk 2.5.2 支持数据标注工厂模式的平台——百度众测 2.6 本章小结 2.7 作业与练习 第3章 群智化数据标注项目的管理方法 3.1 背景简介 3.2 数据标注项目的实施流程 3.2.1 数据采集 3.2.2 数据清洗 3.2.3 数据标注 3.2.4 数据质检 3.2.5 数据交付 3.2.6 数据验收 3.3 数据标注项目管理 3.3.1 人员管理 3.3.2 项目评估 3.3.3 过程管理 3.3.4 进度管理 3.4 数据标注质量管理 3.4.1 数据标注质量控制的意义 3.4.2 数据标注质量控制的概念、流程和方法 3.4.3 数据标注质量评价指标 3.5 数据标注的标准化 3.5.1 数据标注标准化背景 3.5.2 数据标注标准化进展 3.6 本章小结 3.7 作业与练习 第4章 基于平台的群智化数据标注实践 4.1 面向客户的数据标注实践 4.1.1 数据标注项目需求分析 4.1.2 任务设计与发布 4.1.3 数据验收 4.2 面向数据标注员的实践环节 4.2.1 身份认证 4.2.2 数据标注员培训 4.2.3 标注项目参与 4.2.4 标注结果验收 4.3 基于亚马逊MTurk的众包标注实践 4.3.1 任务发布及验收示例 4.3.2 基于MTurk平台的数据标注示例 4.4 基于百度众测平台的数据标注]二厂模式实践 4.4.1 基于百度众测平台的任务发布实例 4.4.2 基于百度众测平台的项目验收实例 4.4.3 基于百度众测平台的标注员实践示例 4.5 本章小结 4.6 作业与练习 第5章 文本数据标注 5.1 文本数据标注简介 5.1.1 文本数据 5.1.2 文本数据标注及其发展 5.1.3 文本数据标注应用场景 5.2 文本数据标注技术和方法 5.2.1 序列标注 5.2.2 关系标注 5.2.3 属性标注 5.2.4 生成性标注 5.3 文本数据标注工具及典型数据集 5.3.1 文本数据标注工具 5.3.2 典型文本数据集 5.4 文本数据标注实践案例 5.4.1 市长热线投诉内容关键要素抽取——辅助工单填写 5.4.2 相关事件、新闻检索 5.5 本章小结 5.6 作业与练习 第6章 音频数据标注 6.1 音频数据标注简介 6.1.1 音频数据标注的概念 6.1.2 音频数据 6.1.3 音频数据标注及其发展 6.1.4 音频数据标注应用场景 6.2 音频数据标注技术和方法 6.2.1 语音属性标注 6.2.2 语音转写 6.2.3 语音切分 6.3 音频数据标注工具及典型数据集 6.3.1 音频数据标注工具 6.3.2 典型音频数据集 6.4 语音数据标注实践案例 6.4.1 智能客服语音数据标注 6.4.2 智能冰箱语音数据标注 6.4.3 面向多轮对话场景的语音数据标注 6.5 本章小结 6.6 作业与练习 第7章 图像数据标注 7.1 图像数据标注简介 7.1.1 图像数据 7.1.2 图像数据标注及其发展 7.1.3 图像数据标注应用场景 7.2 图像数据标注技术和方法 7.2.1 关键点标注 7.2.2 标注框标注 7.2.3 图像区域标注 7.2.4 属性标注 7.3 图像数据标注工具及典型数据集 7.3.1 图像数据标注工具 7.3.2 典型图像数据集 7.4 图像数据标注实践案例 7.4.1 图像数据标注热门实例——3D点云标注 7.4.2 图像数据标注综合案例——0CR光学字符识别 7. |