![]()
内容推荐 在未来10~20年,人工智能将严重冲击我们的职场,超过半数的岗位和从业者面临淘汰。历史上其他因技术进步引起的职业消亡,与人工智能的影响相比均不可相提并论。 人工智能很强大,但并不是没有弱点,它的根本弱点就是:永远无法通过目前的数学或者统计学方法获得更高的阅读能力,即它无法准确理解人类的语言,因而也无法从事许多工作。人工智能的弱点就是我们应该努力的方向。 然而,现行的教育方法只能培养出终将被人工智能所替代的人才。本书作者主持了日本著名的“机器人考东大”人工智能研究项目,以扎实的理论和实验数据细数人工智能的发展现状,展望人工智能时代的未来图景,提供了适应人工智能时代的学习方法,帮助你先人一步做足应对准备。 作者简介 新井纪子,日本国立信息学研究所教授,理学博士,专攻数理逻辑学。2011年起主持名为“机器人考东大”的人工智能研究项目(曾在2017年TED上分享该项目进展和成果),目前致力于阅读技能测试项目的研究和开发。 目录 前言 我对未来的预测 第1章 一流名校金榜题名 人工智能与奇点 人工智能尚未问世 奇点是什么 偏差值57.1 并不是要考东京大学——“东大机器人”的目标 当东大机器人考上一流名校 人工智能进化史 一次传奇聚会 专家系统 机器学习 深度学习 强化学习 惊人的YOLO——最前沿图像识别技术 东大机器人亮相TED 实时物体识别系统 物体识别系统的工作原理 人工智能长眼睛了吗 沃森大显身手 打败答题王 被引进呼叫中心 东大机器人的战略 汇集100名研究者之力 攻克世界史 用逻辑攻克数学 被人工智能夺走的工作 消失的放射影像科医生 新技术是如何夺走人们工作的 再也不能“加倍奉还” 有一半人会失去工作 第2章 挑战东大抱憾而归 阅读理解能力与常识的壁垒——填鸭式教育的盲点 东大落榜 东大机器人不需要超级计算机 大数据幻想 日本与美国的差距 攻克英语的坎坷历程 目标是拿到200分中的120分 常识的壁垒 记住150亿句话 听不懂话的人工智能 计算机就是计算的机器 数学的历史 逻辑与概率和统计 Siri有多聪明 附近有难吃的意式餐厅吗 逻辑无法实现自然语言处理 统计和概率不容小觑 奇怪的钢琴曲 随机过程 自动作曲 暂且忽略不计 无法观测的“含义” 果然,我成不了福岛 机器翻译 雅虎翻译→× 我上周去了山口和广岛 东京奥运会能实现多语种语音翻译吗 图像识别的陷阱 奇点不会到来 人工智能不是浪漫情怀 对科学的局限保持虚心 无法转换成逻辑、概率和统计意味着什么 第3章 你能读懂课本吗 你能胜任“人工智能做不了的工作”吗 今后要靠沟通能力 不只日本人如此 是没学好数学还是没读懂问题——大学生数学能力基本测评 鸡同鸭讲的对话 全国2.5万人的基础阅读理解能力大调查 脚踏实地的调查 根据东大机器人的学习过程开发阅读技能测试 例题介绍 有三分之一的人读不懂简单的句子 亚历桑德拉的昵称 不会判定同义句 与人工智能犯同样错误的人 随机率 偏差值与阅读理解能力 基础阅读理解能力将左右人生 什么决定了阅读理解能力 让学生读懂课本 会被人工智能取代的能力 理解含义才会有用武之地 主动学习的“空中楼阁” 趁热打“恶” 一线老师们的担忧 处方并不简单 人工智能无法对语文主观题自动阅卷 多少岁都能培养阅读理解能力 第4章 最坏的情景 被人工智能分化的白领阶层 为什么要学三角函数 被人工智能取代的人才 因人工智能而分化的白领阶层 消失的企业 展厅现象 被人工智能淘汰的企业 对人工智能的全球恐慌 没人能做人工智能做不了的工作 我的未来预测图 一线光明 后记 序言 我对未来的预测 关于人工智能的讨论实 在太多了。虽然我的这本书 也是关于人工智能的,我这 样说可能有些奇怪,不过是 市面上关于人工智能的书真 的太多了。 甚至有些书叫作《当人 工智能成为上帝》《人工智 能将毁灭人类》《奇点即将 到来》……每当看到这种耸 人听闻的书名,我都会忍不 住想插上一句。 当人工智能成为上帝吗 ——人工智能不会成为上帝 。人工智能将毁灭人类吗— —人工智能不会毁灭人类。 奇点即将到来了吗——奇点 不会到来。 我是一名数学家。我研 发了“东大机器人”,像抚养 孩子一样培育它不断成长, 去挑战东京大学的入学考试 。有这么多人对人工智能感 兴趣,对我来说是一件非常 开心的事。但同时我又十分 担忧,因为很多与人工智能 相关的书,或者简单粗暴, 或者危言耸听,它们所塑造 的人工智能的形象或者关于 人工智能的未来预测已经完 全偏离了事实。 人工智能既不会代替上 帝为我们带来乌托邦,也不 会拥有超越人类的能力而毁 灭我们,至少目前不会。我 说的“目前”,是指如今正在 阅读本书的各位读者以及各 位的子女们在世期间。在这 个范围内的未来,人工智能 或者装有人工智能的机器人 把所有人的工作都夺走的情 况不会出现。人工智能是计 算机,计算机能做的就是计 算而已。知道了这一点,我 们就会明白,所谓机器人夺 走所有人的工作、人工智能 拥有自主意识并为了自己的 生存而攻击人类等想法都只 不过是幻想而已。 既然人工智能仍是需要 在计算机上实现的软件,那 么只要无法把人类的所有智 能活动都用算式表示出来, 人工智能就不可能取代人类 。后文还会详细介绍,对于 希望人工智能成为上帝拯救 人类的人来说,十分遗憾, 现阶段的数学还不具备这种 能力。这不是提升运算速度 或者改进算法就能解决的问 题,而是数学本身的局限。 因此,人工智能既不会成为 上帝,也不会成为征服者, 奇点也不会到来。 哦,原来是这样啊!说 什么我们的工作以后会被人 工智能取代,原来都是骗人 的!这下就放心了……可能 有人看到这里会这样想。不 过很可惜,我对未来的预测 也不是这样的。未来奇点确 实不会到来,人工智能也不 会夺走人类的所有工作,但 在即将到来的社会,确实有 很多工作会被人工智能取代 。也就是说,人工智能虽然 不会成为上帝或者征服者, 但是它已经具有足够的实力 ,能够成为人类的强劲对手 。“东大机器人”虽然没能考 上东京大学,但它的偏差值 已经足够考上MARCH级别 的一流私立大学。 有一些人工智能乐观主 义者认为,即使人工智能会 取代很多工作,但未来还会 出现人工智能无法取代的新 型劳动需求来吸收剩余劳动 力,生产率提高了,经济仍 然会不断发展。他们认为就 像卓别林的“摩登时代”产生 了白领阶层一样,今后也会 出现一些过去没有的职业。 真的会这样吗?我并不这么 乐观。 在推进“东大机器人”挑 战项目的同时,我还对日本 人的阅读理解能力进行了大 规模统计和分析。在这个过 程中,我发现了一个令人震 惊的事实。我发现,大多数 日本初中生和高中生通过填 鸭式教育可能在英语单词、 世界史年表和数学计算等方 面拥有丰富的表层知识,但 他们却看不懂相当于初中历 史或理科课本难度水平的文 章。这个问题非常严重。 对人工智能来说,背诵 英语单词及世界史年表,或 者得出正确的计算结果都是 手到擒来。相比之下,它最 不擅长的是理解课本内容的 含义,本书的正文部分将会 详细说明其原因。 可能很多读者发现了: 咦?那不是跟日本的中学生 一样吗?是的,正是这样。 现代日本劳动力的质量与越 来越强大的人工智能劳动力 非常相似。这说明了什么呢 ? 未来也有可能像人工智 能乐观主义者所预言的,即 使有很多工作被人工智能取 代,也会出现人工智能做不 了的新工作。但是,就算有 了新工作,这些工作也未必 属于被人工智能抢走了饭碗 的劳动者。因为既然现代劳 动力的质量与人工智能相似 ,就意味着对很多人来说, 人工智能做不了的新工作, 他们很有可能也无法胜任。 其实在卓别林的时代, 也曾经出现过类似的情况。 工厂利用传送带实现了自动 化,另一方面事务性工作的 增加形成了“白领”这一新型 劳动阶层。然而这两件事之 间是有时间差的,在大学教 育普及,带来大量白领阶层 之前,有很多工厂劳动者失 去了工作,一时间到处都是 失业者。这也是20世纪初世 界经济大萧条的间接原因。 那个时代确实出现了针 对白领的新的劳动需求,那 为什么还会有那么多的人失 业呢?答案很简单:工厂劳 动者没有接受过从事白领工 作所需的教育,他们无法进 入新的劳动市场。 如今,由于人工智能的 问世,世界即将面临相同情 况。怎样才能避免这种情况 ?作为一名数学家,我能为 此做些什么?我想我能做的 ,就是如实地告诉大家今后 即将出现的情形,而不是宣 扬一些根本不可能实现的未 来幻想。正是出于 导语 震撼全日本的现象级图书,获2019年商业书大奖,销量超300000册! 日本亚马逊730条评论,4.3星好评,各项大奖拿到手软! 各大电视台、报纸、杂志及网络媒体争相评介! 商务人士、教育工作者、家长……人工智能时代,所有人都应该关注的一本书! 东大机器人偏差值达57.1,数学成绩超过99%的高中生。 但人工智能的原理决定了它的致命弱点:无法准确理解人类的语言。 当人工智能在某些方面的实力高于80%的人,你拿什么笑到最后?解锁不被人工智能取代的核心竞争力! 后记 最后我想说,在2017年 的所有TED演讲中(除了第 266代罗马教皇方济各发来 的视频信息),最大的亮点 不是开发了YOLO的约瑟夫· 雷德蒙,也不是开发Siri的 汤姆·格鲁伯,不是埃隆·马 斯克,也不是怀孕的塞雷娜 ·威廉姆斯,而是以“盲目信 仰大数据的时代必须结束” 为题演讲的凯西·奥尼尔。 凯西毕业于全美国最难 考大学之一加州大学伯克利 分校的数学系,之后到哈佛 大学继续深造。她凭借卓越 的数学天赋获得了博士学位 ,曾在MIT等学校执教,然 后又来到华尔街工作。在 2008年金融危机之前,她 是一名大有作为的数据科学 家。 金融危机带来的混乱使 她开始对数据科学这一领域 产生了怀疑。后来,她成立 了一家非营利组织,致力于 揭露大数据科学的欺骗和危 险,而之前人们一直认为大 数据客观且比人类更准确。 在欧美国家,很多场合 是用大数据来衡量人们的价 值的。从车险或寿险的保费 、找工作时能否进入面试, 到教师的解雇标准乃至犯罪 嫌疑人是否会再次犯罪等, 大数据分析都被用来“帮助” 人们做出判断,从而形成基 于数学的“客观评价”。很多 人会毫不怀疑地接受这些机 械的统计判断,然而这是非 常危险的。 为什么呢?读到这里的 聪明读者一定已经知道答案 了。深度学习等统计系统只 不过是根据“训练数据”对过 去数据进行分析和判断的, 只是在沿袭过去的判断。如 果社会失衡,它就会使失衡 进一步加剧。训练数据或注 解设计反映了设计者的价值 观。如果女性数学家的人数 比较少,那么人工智能在根 据大数据为女高中生推荐“ 将来应从事的工作”时,就 绝不会推荐“数学家”这个选 项。 通过有监督深度学习, 人工智能的精度绝不会超过 训练数据。如果训练数据的 设计者居心叵测或者麻木不 仁,那么他居心叵测和麻木 不仁的程度都会被人工智能 放大。是的,正像微软开发 的聊天机器人Tay会称赞纳 粹一样。 除了围棋或日本象棋等 规则完全确定的问题,其他 领域引进深度学习都不可避 免地需要制作训练数据。什 么是对的,什么有价值,对 谁有意义等,都需要有人教 给人工智能。这些问题不是 以民主形式决定的,而是在 你不知道的某个地方,由你 不认识的某个人随意确定的 。 接下来,我要感谢真挚 诚恳、才华横溢的各位同事 ,他们不畏风险、全心全意 地参与“机器人能考上东京 大学吗”和“阅读技能测试” 这两个在全世界都还没有先 例的项目。我要衷心感谢国 立信息学研究所前所长坂内 正夫先生和已故前副所长东 仓洋一先生,每当我突发奇 想且不计后果地提出一个项 目,他们总是苦笑着鼎力相 助。还有诸野绘里香女士、 石山晴美女士、小林登纪子 女士以及我的家人,他们总 是全力配合我,永远信任我 、支持我。还要感谢山崎豪 敏先生和岩本宣明先生,他 们在本书的编辑过程中给予 了我莫大帮助。最后,我还 要感谢神明,让微不足道的 我能遇到这些优秀的人们。 此外,我现在的目标是 为所有初中一年级学生免费 提供阅读技能测试,科学地 评估他们在阅读理解方面的 偏差和不足,确保所有人都 能在初中毕业之前读懂课本 。这样就可以避免最坏的情 景,在人与人工智能共存的 21世纪30年代,让日本实 现“软着陆”。文部科学省实 施全国学力及学习情况调查 ,每学年需要约25亿日元费 用,而为所有初中一年级学 生免费提供阅读技能测试也 需要一定成本。 我决定将本书版税全额 捐献给从2018年度开始提 供阅读技能测试的“为了教 育的科学研究所”。我们将 用这部分初始资金构建阅读 技能测试系统,制作测试题 ,让尽可能多的初一学生免 费参加测试。 我提供免费测试有一个 条件。初一学生只是参加测 试,拿到结果,并不能提高 阅读理解能力,因为恐怕很 多学生都会只看一眼结果就 团成一团扔掉(就像我和各 位读初中时也曾这样对待测 验成绩一样)。老师和家长 的作用非常关键,从户田市 的事例可以发现,掌握每个 学生的阅读理解能力的同时 ,只有老师们亲自参加收费 版阅读技能测试,由PTA 和 学校及教育委员会共同思考 “学生到底为什么没学好”“ 怎样才能让孩子读懂课本” 等问题,才能见到成效。因 此,我会优先为已经做好相 应准备的教育委员会提供测 试。尽管如此,我们的资金 恐怕还是不够。除了初中生 ,高中生、大学生以及社会 人士都需要阅读技能,希望 能有更多的人来参加测试。 让我们一起迎接幸福的 2030年吧。 精彩页 人工智能与奇点 人工智能尚未问世 在开始之前,为了防止我们关于人工智能和奇点的讨论引发困惑,首先我需要澄清以下几点。第一点是人工智能其实在任何地方都还没有问世。人工智能的英语叫作artificialintelligence,简称AI。日语里平时常说的人工智能一般是指具有智能的计算机。 既然叫人工智能,那么就算不能与人类完全相同,至少也要具有同等水平的智能。而从本质上看,计算机所做的都是运算,或者更直接地说,都是四则运算。因此人工智能的目标,就是用四则运算来表现人类的智能活动,或者让人们觉得它能表现人类的智能活动。 要实现人工智能,有两种方法论。反过来,也可以说是只有两种方法论。一种是从数学上阐明人类智能的原理,再从工学上再现出来。还有一种方法是不了解人类智能的原理,但通过不断进行工学上的实验,有朝一日发现“咦?不知不觉中就实现了人工智能”。 现在大多数研究人员藏在心底的想法是,第一种方法从原理上来看是无法实现的。因为根本就没有科学观测人类智能的方法。我们的大脑如何运转,它感觉到了什么,它在思考什么,我们自己都看不到。我们读了一段文字就能理解其中的含义,就连这个过程到底是什么样的活动,我们都还完全没有头绪。把传感器接入大脑也无法解答这个问题,传感器只能监测到电子信号或血流等物理现象。何况在现代,动物实验都要受到严格限制,把传感器直接嵌入健康人的大脑就更不可能获得许可了。无法比对测量结果进行验证,即使能提出“会不会是根据这一原理运转的”的假设也于事无补。无法实时观测人类智能活动,我们就连科学阐释人类智能的起跑线都还没有到达。 那么第二种方法呢?认为第二种方法可以实现人工智能的人常用飞机的例子做论据。他们认为,人们并没有从数学上彻底掌握飞机飞行的原理,但现实中飞机早就飞上了天。因此(这个“因此”其实并不符合逻辑),我们一定也可以依靠优先工学的方法实现人工智能。实现人工智能之后,数学家就可以随便花多少时间去探索“大脑为什么会如此运作”了。我不能完全排除这种可能性,但这跟我不能完全排除银河系的某个地方存在一个跟地球一样的星球,那里生存着智能水平远超人类的生物的可能性没有太大区别。 只有一点是我可以断言的:通过大家如今热衷的深度学习等统计方法的延伸或者扩展不可能实现人工智能。详细的原因后文还会详细介绍,这是统计这种数学方法本身的局限决定的。 综上所述,遥远的未来暂时还不清楚,至少在较近的今后,人工智能还不会出现。然而现在,我们随处都能看到“人工智能”这几个字,就连我本人也正在随意地使用这个词。 为什么会这样呢?这是因为我们其实混淆了人工智能与人工智能技术的含义。人工智能技术是指为了实现人工智能而研发的各种技术,包括最近比较热门的语音识别技术、自然语言处理技术和图像处理技术等。大家听说过Siri吧?向智能手机提出问题,它就会为我们提供各种信息。Siri应用的就是语音识别技术和自然语言处理技术。后文还会详细介绍,图像识别技术在最近几年有了长足进步,甚至可以说已经具备了视觉能力。此外,语音合成技术和大家平时上网检索时常用的信息搜索技术、文字识别技术等领域都通过多年研究取得了各种进步,大大地推动了人工智能技术的发展。 如今,我们把上述各种人工智能技术都简单地统称为人工智能。可能大家觉得,虽然还不知道何时才能实现人工智能,但它终归是人工智能技术研发的最终目标,所以普通人严格区分这二者也未必有太大意义,再说每次都要说人工智能技术也很麻烦,所以干脆就把人工智能和人工智能技术混在一起用了。所以准确地说,本书中反复出现的“东大机器人”这种人工智能,其实是一种人工智能技术。 可能有读者会奇怪,为什么要在进入正题之前讨论这个并无大碍的问题,这是因为我觉得混淆人工智能和人工智能技术会带来一些危害。智能手机和扫地机器人自不必说,人工智能技术早已成为我们的伙伴,渗透到日常生活的方方面面。我们有时会随意地把这些都叫作人工智能。但把人工智能技术叫作人工智能,可能造成误解,让大家以为其实根本不存在人工智能已经问世或者即将在不远的将来问世。其结果就是导致人们误以为将来所有的工作都会被人工智能取代,并以这种错误观念为前提讨论相关问题。可如果前提都是错的,那又怎么可能得出正确的答案呢。这就是我所说的危害。 出于这个原因,本书在接下来会严格区分人工智能与人工智能技术。但每次都写成人工智能技术确实很啰唆,而且也不太符合大家的印象,所以我会按照目前的普遍做法,把人工智能技术写成“人工智能”。然后在需要提及原本意义上的人工智能时,我会写成“真正意义上的人工智能”。 奇点是什么 与人工智能相关的概念当中,人们最关心的可能就是奇点(singularity)了。我们经常可以看到有人讨论奇点到底会不会到来。非数学或人工智能专业人员所说的奇 |