![]()
内容推荐 “人工智能超入门丛书”致力于面向人工智能各技术方向零基础的读者,内容涉及数据思维、数据科学、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,体系完整、内容简洁、文字通俗,综合介绍人工智能相关知识,并辅以程序代码解决问题,使得零基础的读者快速入门。 本书是“人工智能超入门丛书”的一个分册,以机器学习为主线,介绍如何利用机器学习进行数据分析。全书内容共分7章,主要包括机器学习基本概念、数据分析相关基础知识、机器学习解决四类问题(回归问题、分类问题、聚类问题、降维问题)的算法、神经网络相关知识,并在附录中对Python编程基础知识、数据相关数学知识以及Python实验室Jupyter Lab的使用进行了介绍。 本书面向在人工智能方向零基础的读者,内容全面系统,语言通俗易懂,配合典型程序操作练习,简单易上手,能够帮助读者轻松认识和理解人工智能核心技术。本书可以作为大学生以及想要走向人工智能工作岗位的技术人员的入门读物,也可作为青少年人工智能相关技术方向的课程教材,同时也可作为技术普及读物供对人工智能技术感兴趣的读者阅读。 作者简介 龚超,日本工学博士,清华大学日本研究中心主任助理,深圳清华大学研究院下一代互联网研发中心核心成员,未来基因(北京)人工智能研究院首席专家,教育部教育信息化教学应用实践共同体项目特聘专家。中国人工智能学会中小学工作委员会委员,中国自动化学会普及工作委员会委员。研究方向为人工智能优化算法,人工智能在数字化转型中的应用等。多家500强企业数字化转型领域高级顾问,在国内外期刊上发表文章共计60余篇。 目录 第1章 机器“学习” 1.1 数据科学、人工智能与机器学习 1.1.1 数据科学与机器学习 1.1.2 人工智能≠机器学习≠深度学习 1.2 机器学习概述 1.2.1 机器学习是什么 1.2.2 机器学习学什么 1.3 数据素养 1.3.1 何为数据素养 1.3.2 数据素养的维度划分 第2章 数据基础 2.1 先利其器 2.2 科学计算 2.2.1 向量与矩阵生成 2.2.2 向量与矩阵运算 2.3 数据分析 2.3.1 Series与DataFrame 2.3.2 文件的导入与处理 2.4 数据可视 2.4.1 基本图形 2.4.2 画图点睛 第3章 回归问题 3.1 什么是回归问题 3.1.1 回归分析概述 3.1.2 最小二乘法 3.2 线性回归 3.2.1 一元线性回归 3.2.2 多元线性回归 3.3 进阶:可视化 第4章 分类问题 4.1 什么是分类问题 4.2 近朱者赤近墨者黑的k近邻 4.2.1 k近邻算法基本原理 4.2.2 k近邻算法实践 4.3 通过熵解决分类的决策树 4.3.1 决策树与信息熵 4.3.2 决策树案例与实践 4.4 进阶:距离 第5章 聚类问题 5.1 什么是聚类 5.2 K均值聚类 5.2.1 K均值聚类原理 5.2.2 K均值聚类实践 5.3 系统聚类 5.3.1 系统聚类原理 5.3.2 系统聚类实践 5.4 进阶:再谈距离 第6章 降维问题 6.1 什么是降维问题 6.2 主成分分析 6.2.1 主成分分析原理 6.2.2 主成分分析实践 6.3 奇异值分解 6.3.1 奇异值分解原理 6.3.2 奇异值分解实践 6.4 进阶:特征值与特征向量 第7章 神经网络 7.1 从神经元到感知机 7.1.1 从生物神经元到人工神经元 7.1.2 从单层感知机到多层感知机 7.2 神经网络的运行原理 7.2.1 结构概述 7.2.2 前向传播 7.2.3 反向传播 7.3 神经网络的参数说明与实践 7.3.1 参数与超参数 7.3.2 解决分类与回归问题 7.4 进阶:反向传播推导 附录A Python基础 A.1 运算符 A.1.1 基本算术运算符与数值型 A.1.2 关系运算符、逻辑运算符与布尔型 A.2 字符串与数据结构 A.2.1 字符串 A.2.2 列表 A.2.3 元组 A.2.4 字典 A.3 控制结构 A.3.1 if语句 A.3.2 while语句 A.3.3 for语句 A.3.4 多重循环 A.4 定义函数 附录B 导数与代数基础 B.1 导数 B.2 向量 B.3 矩阵 附录C 腾讯扣叮Python实验室:Jupyter Lab使用说明 序言 新一代人工智能的崛起 深刻影响着国际竞争格局, 人工智能已经成为推动国家 与人类社会发展的重大引擎 。2017年,国务院发布《 新一代人工智能发展规划》 ,其中明确指出:支持开展 形式多样的人工智能科普活 动,鼓励广大科技工作者投 身人工智能的科普与推广, 全面提高全社会对人工智能 的整体认知和应用水平。实 施全民智能教育项目,在中 小学阶段设置人工智能相关 课程,逐步推广编程教育, 鼓励社会力量参与寓教于乐 的编程教学软件、游戏的开 发和推广。 为了贯彻落实《新一代 人工智能发展规划》,国家 有关部委相继颁布出台了一 系列政策。截至2022年2月 ,全国共有440所高校设置 了人工智能本科专业、387 所普通高等学校高等职业教 育(专科)设置人工智能技 术服务专业,一些高校甚至 已经在积极探索人工智能跨 学科的建设。在高中阶段, “人工智能初步”已经成为信 息技术课程的选择性必修内 容之一。在2022年实现“从0 到1”突破的义务教育阶段信 息科技课程标准中,明确要 求在7-9年级需要学习“人工 智能与智慧社会”相关内容 。实际上,1-6年级阶段的 不少内容也与人工智能关系 密切,是学习人工智能的基 础。 人工智能是一门具有高 度交叉属性的学科,笔者认 为其交叉性至少体现在三个 方面:行业交叉、学科交叉 、学派交叉。在大数据、算 法、算力三驾马车的推动下 ,新一代人工智能已经逐步 开始赋能各个行业,现在几 乎没有哪一个行业不涉及人 工智能有关元素。人工智能 也在助力各学科的研究。近 几年,Nature等顶级刊物不 断刊发人工智能赋能学科的 文章,如人工智能数学、化 学、生物、考古、设计、音 乐以及美术等的结合。人工 智能内部的学派也在不断交 叉融合,像知名的AlphaGo ,就是集三大主流学派优势 制作,并且现在这种不同学 派间取长补短的研究开展得 如火如荼。总之,未来的学 习、工作与生活中,人工智 能赋能的身影将无处不在, 因此掌握一定的人工智能知 识与技能将大有裨益。 根据笔者长期从事人工 智能教学、研究经验来看, 一些人对人工智能还存在一 定的误区。比如将编程与人 工智能直接画上了等号,又 或是认为人工智能就只有深 度学习等。实际上,人工智 能的知识体系十分庞大,内 容涵盖相当广泛,不但有逻 辑推理、知识工程、搜索算 法等相关内容,还涉及机器 学习、深度学习以及强化学 习等算法模型。当然,了解 人工智能的起源与发展、人 工智能的道德伦理,对正确 认识人工智能和树立正确的 价值观也是十分必要的。 通过对人工智能及其相 关知识的系统学习,可以培 养数学思维(Mathematical Thinking)、逻辑思维 (Reasoning Thinking)、 计算思维(Computational Thinking)、艺术思维 (Artistic Thinking)、创新 思维(Innovative Thinking )与数据思维(Data Thinking),即MRCAID。 然而遗憾的是,目前市场上 既能较综合介绍人工智能相 关知识,又能辅以程序代码 解决问题,同时还能迅速入 门的图书并不多见,因此笔 者策划了本系列图书,以期 实现体系内容较全、配合程 序操练及上手简单方便等特 点。 本书以传统的机器学习 为主线,按照如下内容进行 组织:第1章介绍机器学习 的基本概念;第2章介绍掌 握机器学习时必须要了解的 一些关于数据分析的基础知 识;第3章~第6章分别介绍 机器学习解决四类问题的算 法,即回归问题、分类问题 、聚类问题以及降维问题, 第3章在讨论什么是回归问 题的基础上介绍了一元线性 回归与多元线性回归,在第 4章中,首先对分类问题进 行了界定,并介绍了利用k 近邻算法与决策树两种不同 的分类算法,第5章介绍了 聚类问题以及两种不同方式 的聚类算法——K均值聚类 与系统聚类等内容,第6章 介绍了降维问题、主成分分 析以及奇异值分解等内容; 第7章对神经网络的相关知 识展开系统介绍。本书的附 录部分回顾了Python的基础 知识,介绍了关于导数与代 数等数学基础知识,同时还 介绍了Python室验室 Jupyter Lab的使用。 本书的出版要感谢提供 热情指导与帮助的院士、教 授、中小学教师等专家学者 ,也要感谢与笔者一起并肩 参与写作的其他作者。在本 书的出版过程中,未来基因 (北京)人工智能研究院、 腾讯教育、阿里云、科大讯 飞等机构提供了大力支持, 在此一并表示感谢。 由于水平有限,书中内 容不可避免地存在疏漏与不 足,欢迎广大读者批评指正 并提出宝贵的意见。 龚超 2022年9月于清华大学 |