![]()
作者简介 [日] 野村直之,Metadata Incorporated公司董事长、法政大学研究生院创新管理研究专业兼职教员。 1984年毕业于东京大学工学院,2002年获得九州大学理学博士学位。先后就职于NECC&C研究所、JustSystems、法政大学、日本理光集团,后出任法政大学研究生院客座教授。2005年创立Metadata Incorporated公司。主要提供大数据分析、社会化应用,以及各种人工智能应用解决方案等服务。 期间,出任美国麻省理工学院(MIT)人工智能研究所研究员。与“人工智能之父”马文·明斯基属同一研究室。曾与同为MIT的语言学者诺姆·乔姆斯基交流讨论。不仅参与研究了支撑深度学习的ImageNet的基础WordNet,还同时参与过从日本第五代计算机开发机构ICOT分立出来的知识库的开发。在从事各种软件开发的同时,对AI在产业、生活、行政、教育等领域的应用问题也极为关心。 著有WorldNet: An Electronic Lexical Database ,edited by Christiane D.Fellbaum ,MIT Press ,1988.(合著)。 同时在信息处理、AI应用等相关杂志上发表过多篇论文。参加过多场讲座。 后记 本书是为制定AI战略的经营人员及现场执行人员编 写,旨在增进两者的互相理解和沟通及目标的共享,由此 提升服务水平和服务范围,提高生产效率。 为此,我努力收集了很多具体的材料,其中包括了AI 企业通过实践获得的极有价值但从未公开的经验。在如今 充斥着与AI有关的各种新闻与信息的环境中,能真正帮助 我们实现目标的永恒不变的举措,就是我在本书中阐述的 对于精确率和召回率的精度目标的设定,以及利用混淆矩 阵设计新的业务流程的理念。例如,产品的外观检测中, 如果合格品与不良品的混淆精度在一定水准以下,那么即 使存在合格品的可能性也依然被检查对象做报废处理,以 此可以降低整体的检测、报废成本。如果人力成本大于AI 开发加上运营成本,就能够提升生产效率,增加收益率。 同时,在本书中提到识别与分类的判断条件无法规范 化,并且难以用语言和数学公式来定义,为此需要制作大 量样本数据。我对于样本数据制作的难度与高昂成本也做 了详细的说明。在制作样本数据时如有失误,就会导致AI 的精度低下。如果精度过低,则可能导致AI开发项目的完 全失败,甚至与竞争对手之间产生致命性的差距。 由于样本数据制作本身的规范并不充分,要保证它的 质量和数量并不容易。因此,如果标注人员不尽责,那么 即使投入很大成本也无法获得良好的品质。另外,标签标 注的工具也非常重要。除此之外,做好知识的移交、培训 及质量管理,避免项目产生瓶颈也是AI开发成功的关键。 质量管理的具体方法包括抽样检查和原型AI判断结果 的差异比较等。为了推测来自样本数据的误差分布,可以 考虑使用统计学的bootstrap方法。事实上,为了让标注 工作更顺利,我们应该首先构建一个良好的用于标签标注 的用户界面,尽力同时实现质量改进与效率提升。 软硬件和开发框架将在未来继续快速扩充。HDD与CPU 的发展已很难再遵循摩尔定律,但集成了多个GPU的超级计 算机的性能仍然保持着指数级的增长,价格也越来越低。 就此点而言,在数据制作与维护方面采用高端的硬件也许 比使用人力更廉价。可以参考本书中对于倍精度、标准精 度、半精度之间的性能差异,以及主板、内存的要求的说 明内容,选择当时性价比最高的硬件组合。 软件组件和开发框架的选择,也需要根据目的、选择 的机器学习种类、实施策略(各种功能和性能、精度等非 功能性要求、开发语言、通用性等)进行选择。 第3章中表3-2所示的混淆矩阵非常重要。日本的交 通标志(图3-2等)在形状完全不同的群体中有深红色形 状,有圆形红色条纹、倒三角形、蓝色圆形、矩形、黄色 钻石形等不同的形状。对于形状完全不同的标志,进行过 深度学习后,判断结果几乎不会发生混淆。而形状相同的 标志,如对于同样是黄色钻石形状的注意落石标志和注意 动物标志的识别,会发生一定概率的混淆。但实际的驾驶 场景中,两个标志的识别即使发生混淆,对于司机和汽车 来说,要做出的反应几乎相同——“注意四周情况”。 如果两个标志都是红圈内有一个“×”,一个在圈里 有“禁止通行”,一个圈里有“禁止停车”的文字会如 何?对于目前的AI而言,这两个标志几乎相同,很难消除 混淆。看到这两个标志时要采取的行动恰好相反,一个是 “停车”,一个是“不能停车,继续前进”,这样的混淆 产生的后果就非常严重。如果自动驾驶的车辆因为识别错 误而不当停车,就可能发生被后方车辆追尾导致乘客受 伤。 也许意义相反的标志采用相似的设计本身并不妥当。 日本政府正准备参考联合国的样式修改交通标志。希望以 此为契机,交通标志的图案能变得更易于AI识别,当然对 于人类而言会更不易误认。 …… 再者就是被称为“特洛伊木马”(Trojan Horse)的 针对深度学习的恶意软件。即在AI系统所依附的神经网络 结构中植入缺陷,使得某种契机下网络架构会发生局部变 化。变动后的网络架构与正常架构很难分辨,随着迁移学 习的普及会造成严重的影响。 随着机器学习的全面普及,业务流程变得更为复杂, 同时也将更为丰富。利益相关者也会增加,权利关系和责 任关系也会复杂化。而当前的法律制度尚有许多不足,对 于完成学习后的神经网络这种花费大量经验与成本,通过 反复评估与改善获得的结晶,目前的知识产权法尚无法为 其提供充分的保护。如在我的另一部著作《人工智能改变 未来》中所述,AI的版权归属和使用也存在问题。 在改善法律制度的同时,在数据主导型经济体制下, 对于AI开发人员和AI部署的相关人员的正当权利(同时明 确义务和处罚)的保护,日本不能再继续落后于其他国 家。我期待能够立法促进AI迅速而广泛地普及。 当然,法律的完善并不意味着AI的引入就必然变得顺 利。即使用混淆矩阵构建了新业务流程,仍然有必要随时 更新,并灵活地跟踪判断结果和概率值分布的变化。我称 之为流动型业务流程。 如果疏于重新审视业务流程,低效的 目录 第1章 当今AI的功能与局限 关于AI常见的误解 利用大数据的围棋AI 如何有效运用“幼儿智能” 思考能够使用图像识别技术的商业领域 深度学习是“原始数据计算” 通过三个数轴对AI进行分类 深度学习是如何提取特征的 “模式识别”:AI的眼睛和耳朵 使用深度学习的机器翻译能够获得压倒性胜利的原因 “强AI”的出现至少要到22世纪吗 指数函数的恐怖 知识量的增加至多是二次曲线级 充分运用深度学习的必要性 深度学习与其他方式的结合也很有价值 第2章 使用深度学习的基本流程 在AI应用中不可或缺的目标设定 分享评测数据使其可以共用 作为精度指标的“精确率”和“召回率” 作为前提的正确结果不止一个 不同场景中对精确率和召回率的重视程度不同 业余和专业所需的精度是不同的 深度学习的准确性评估测试非常简单 能准备反映共同特征和多样性差异的训练数据 使用开发环境进行数据学习的流程 注意过度拟合 第3章 目标精度的实际评估和利用 从危险驾驶分类中了解自动驾驶的问题 AI给生产力带来的提升效果 交通标志与AI的匹配和RFID化也是必要的 精度目标的设定和预算是“鸡与蛋”的问题 自动驾驶需要用各种观点进行综合评估 特斯拉汽车为何发生车祸 结合预期值评估服务质量非常重要 设计业务流程时的混淆矩阵很重要 用附有概率值的判定结果将分支条件精细化 根据置信度对处理结果进行场景分类 为每个样本或医疗机构设置最佳精度 对AI纠错的意义 如何评估聊天机器人的准确性 用“对话成立度”对精度进行定量评估 参考信息技术架构库改善业务流程 让AI学习特殊情况下的数据 第4章 AI部署的实例 企业的数字化 将AI API化后公开 AI部署的战略以及企业内部体制 制作样本数据时的注意点 标注人员进行的标注工作 增加相互之间只有少许差异的样本数据 深度学习的引入需要耐心 描绘实际运行整体系统的结构 GPU的挑选:目前NVIDIA是唯一选择 硬件的选择:性能要超过十几年前最先进的超级计算机 主内存要注意主内存容量 GPU云服务也是一种选择 深度学习的机制是多种多样的 主流深度学习框架的特点和选择 多种类型的网络结构该如何进行选择 编程语言几乎只有Python一种选择 利用现成AI资源的意识 将完成后的AJ应用程序化、API化 将API向世界公开 争取各种安全措施保护隐私 以眼还眼,以AI对AI 保护AI开发企业的防盗版措施 主动公开部分源代码的交付方法 第5章 AI部署人才应具备的技能 用户企业如何获得A1人才 用户企业的管理人员应掌握的心得 AI时代需要我们具备福尔摩斯般的思考能力 A1人员所需的资格和专业领域 旧知识可能成为绊脚石 样本数据的准备成为开发工作的核心 在API经济中擅长混聚开发的人才更重要 A1人员的沟通能力不可或缺 知识会迅速过时 从知识劳动到智能劳动 知识将可以无偿获得 思考人类与AI的角色分担 即使没有大数据,人类也可以相对准确地推断 实现不同专家合作的“配对需求开发” 推动AI项目的关键人才 熟练工艺移植给AI后的产业空心化对策 第6章 将AI用于商业用途时需注意的问题 大数据越来越重要 利用AI防止人类被数据牵制 AI的知识获取瓶颈 数据准备和增值更要活用AI 准备和收集样本数据时的要点 AI在日本的应用前景广阔 与人类相同的服务员AI会出现吗 人文和哲学对于AI研究人员来说非常重要 基本收入制度无法解决问题 将AGI作为工具使用 结语 精彩页 本章将会总结目前以深度学习为代表的AI的大致情况,并对其已具有和尚未具有的能力进行归纳。 如本书引言所述,目前的AI作为一种辅助性工具,主要在图像、声音识别方面具有很强的实用性,而且发展迅速。我们可以预见,AI今后将与人类一样拥有视觉、听觉和读写能力,并被广泛地应用到各个行业,取代人类完成一部分工作,最终在提升生产效率、创造社会财富和缓解劳动力不足方面发挥价值。 遗憾的是,目前大众对于AI还存在很多认识上的误区。比如,过度关注需要几十年或几百年才能实现的“强AI”以及具有和人类同等知性的“通用AI”,并将它们与目前作为辅助性工具应用在商业领域的局部AI混淆。虽然后者在当前更为重要,但相关的讨论,比如怎样将目前已经成熟的AI技术应用于短期的企业战略规划,如何用AI重构业务流程、提高生产效率等话题,却很少听到。 事实上,对于企业而言,并不需要在三年或者五年的短期计划中考虑“强AI”或“通用AI”。让我们先从这一点开始吧。 关于AI常见的误解 目前的AI并非“通用AI”,而是只能完成特定工作的专用AI,其种类高达上千种。大众对AI过度的期待,以及对AI所持有的理想与现实存在巨大落差而深感失望的现状,很可能源自对AI的实际应用情况了解不足,或者对它存有误解。高德纳(日本)IT咨询公司在2016年12月发表了关于AI常见的误解: 1.具有高度智慧的AI已经存在; 2.如果导入类似于IBM沃森那样的机器学习、深度学习的技术,任何机器都能变得无所不能; 3.存在一种名为AI的单一技术; 4.只要引入AI就能立刻见到效果; 5.“非监督式学习”过程不需要指导,所以比“监督式学习”先进; 6.深度学习是最强大的; 7.算法如同编程语言一样可以随意选择; 8.存在任何人都可以立刻上手的AI; 9.AI是一种软件技术; 10.到头来AI什么也干不了,毫无意义。 很多层面的问题交织在一起,导致了以上误解的产生。事实上这几种说法都不正确。 “具有高度智慧的AI已经存在”的说法显然不正确。目前“通用AI”尚未诞生,我们对如何创造也无从知晓。就连“AI”的精准定义,我们都尚未有定论。 “只要使用了AI后就可以变得无所不能”的想法也是错误的。要想让AI发挥作用,就必须努力获取、积累大量样本数据和词库,评测并提升系统精确度,将其应用到业务实践中。如果不下这样的苦功,那么即使用了AI也解决不了眼前的问题。关于这一点,我会在第2章里详细说明。同样的理由,关于“只要引入AI就能立刻见到效果”和“存在任何人都可以立刻上手的AI”的说法也是不对的。 其实,对于“只要引入AI就能立刻见到效果”的说法,我认为并不妥当。在由人工智能学会编撰的厚达1600页的《人工智能学大事典》中介绍的AI多达上千种,这些AI既类似又不尽相同。每个AI的来源与目的、实际状态各有差异。然而,媒体在报道时经常会粗略地说“这种产品使用了AI”,从而导致了类似“存在一种名为AI的单一技术”的误会在大众中蔓延。剩下的几个错误观念,其产生的原因与深度学习、非监督式学习/监督式学习有关,我会在第2章中详细论述,也希望读者在阅读相应内容后再做出判断。 反过来,那种认为“到头来AI什么也干不了,毫无意义”的说法又是另一种极端。依靠当今已实现商业化的AI技术,计算机已经能够通过“眼观耳闻”来辨认物体了。正所谓物尽其用,计算机作为工具,借助人类的智慧和创意,在解决问题、提供服务方面的确有着无限的可能。 如果今后AI应用的落地足够成熟,那以前许多只能依靠手工以及因工作量太大而不得不放弃的工作,都有可能交给AI来完成。 P2-4 导语 本书是为制定AI战略的经营人员及现场执行人员编写,旨在增进两者的互相理解和沟通及目标的共享,由此提升服务水平和服务范围,提高生产效率。 作者在这本书中主要针对已经参与或即将参与AI系统相关工作的读者来揭示AI的本质,同时说明引入AI系统时必不可少的精度测试,以及以此为基础的业务流程(扩展、复杂化)设计方法等诸多为了充分运用AI系统需要掌握的要点。 序言 ▲未来AI时代人类工作的价值 如今,人工智能(以下称AI)技术得到了迅速发展, 已具备了识别图像、声音、数列、文章的能力,这也让以 往的计算机望尘莫及。例如,AI能够轻而易举地在合影照 片中识别出具体的人物,而且准确度高,其能力已经相当 于儿童的水平,实在令人惊叹。 一方面,这样的进步让从事AI研究的人员感到非常兴 奋。虽然未来充满了不确定性,但大家似乎已经都沉浸在 “AI无所不能”的乐观情绪之中。许多媒体都开始声称 “AI能和人类一样学习进化”“AI能顺应大趋势进行决 策”,然而,这些说法其实与事实还有很大的差距。更有 学者表示,“AI的进化将剥夺人类的就业机会”,这又让 一些人陷入了焦虑当中。 另一方面,提供AI产品与服务的企业为了宣传产品的 效果,不断强调AI是数字化的劳动力。这些宣传会让人产 生错觉,以为现在的AI已经具有自我意识和责任心,所有 的行为都能与人类一样符合社会常识。 除了以上种种,所谓“人工智能”的称呼本身,也确 实容易让人高估它的能力。事实上,目前社会中流行的关 于AI的各种说法中包含了很多误解。 我可以断言,短期内不可能出现具有完整人格的AI或 机器人。除了一部分特殊的单纯性工作(如只需要依靠视 觉的岗位会完全交由AI负责),对于普通性工作,AI能够 替代人类完成的部分,也只占到全部工作的1%~30%。 NTTDATA经营研究所在2017年7月发表的针对东京地区 和其他城市地区约1000名白领的调查报告显示,他们认为 AI取代了自己大约30%的工作内容。这样的结果和我的预 测几乎一致,反倒让我有些惊讶。 这一结果也几乎与未来五年或十年内AI提高白领工作 效率的预测一致。预测显示,使用AI能使生产效率提升3% ~5%。 ▲合理使用Al的方式 一方面,当大众听说“AI的进化将剥夺人类的就业机 会”,出于对机器的担忧和反感,就会产生逆反心理,从 而造成对AI能力的过高预估;另一方面,当这种过度的期 待没有实现时,又会走向另一个极端,即对AI的全盘否 定,如认为“AI什么也干不了”“真要用AI的话,得费很 多周折”“不给AI供应商提供大量数据就没法用”“到头 来AI还不是一无是处、毫无意义”。 和过高的期望一样,因为不了解AI的真实情况和能力 就将其全盘否定,也是对AI的误解之一。我们该如何澄清 关于AI的各种误解,使企业能够妥当地使用AI?此处所谓 的妥当使用,是指企业通过运用AI能获得较高的投资回报 率(ROI),合理地提升生产效率,让人类工作者能够腾出 手来从事更有意义、更有趣、更富有价值的工作内容,从 而获得幸福感。 我在这本书中主要针对已经参与或即将参与AI系统相 关工作的读者来揭示AI的本质,同时说明引入AI系统时必 不可少的精度测试,以及以此为基础的业务流程(扩展、 复杂化)设计方法等诸多为了充分运用AI系统需要掌握的 要点。本书将就以下的疑问进行详细地解答。 ·虽然对目前的AI有基本的理解,但不清楚具体该做 什么,也不知道该从何处入手。 ·构建AI系统时应该使用什么样的硬件和软件? ·听说有很方便的AI云服务,是真的吗? ·自己的企业内部并没有可以立即用于机器学习的大 数据,该怎么办? ·希望能用到货真价实、性价比高的AI产品和AI系统 实施服务,但如何才能辨别? …… 在人类的工作从知识劳动转向“智能劳动”的时代, 明确为此需要怎样的教育以及在职培训是很重要的课题。 最后,在第6章中,我们会审视日本在AI应用方面与 欧美国家及中国之间的差距。即使日本拼命努力,这些差 距也可能无法缩小,反而会日益扩大。这是日本面临的严 峻现实。 大多数情况下,在应用许多单一功能的专用AI后,业 务流程会变得更加复杂,人类的工作数量与种类也会随之 增加。到2030年时,日本劳动人口数可能会减少到只相当 于2012年87%的水平。此消彼长,相对于失业,日本会面 临更严峻的劳动力不足的问题,有必要认真思考更有效的 AI应用方法了。 今后几十年内,如果通过AI技术的落地应用而提升的 生产效率只有百分之十几的话,那在不断为更多消费者提 供高质量服务的国际背景下,即使消费者的需求日益增长 带来巨大的市场机会,日本也无法参与竞争。 经济产业省在2016年表示,按目前的情况,因工作被 AI和机器人取代而失业的人员数量最高可达735万人。这 个预测的最大问题在于测量生产效率时往往低估了商品数 量(包括服务在内的产品数量)的增加。 近年来,随着智能手机的迅速普及,一些通过优秀的 App提供颠覆性服务的行业,也会带动其他行业转变,因为 消费者的需求被这些行业提升了。在服务质量的提高以及 服务对象范围的扩展中,社会整体的幸福感也被提升了。 假设服务质量与服务对象范围都提升10倍,那么商品数量 作为计算生产效率时的分子,就应该将两者相乘而得到提 升100倍的结果。 “质量×数量”使得商品数量相应 内容推荐 当人们听说“AI的进化将剥夺人类的就业机会”时,出于对机器的担忧和反感,他们就会产生逆反心理,从而造成对AI能力的过高预估;另一方面,当这种过高的期待没有实现时,人们就会产生对AI的全面否定,如“AI什么也干不了”“到头来还不是一无是处、毫无意义”。我们该如何澄清关于AI的各种误解,使企业能够从容自如地使用AI? 本书作者野村直之30多年来一直致力于AI的开发、应用和部署。在本书中,他针对已经参与或即将参与Al系统相关工作的读者揭示了诸多为了充分应用AI系统需要掌握的要点。 ·AI的现状。目前的AI都是辅助性工具,“强AI”还无法在21世纪内诞生。 ·AI的核心技术——深度学习。AI应用落地的关键在于目标精度的评测与活用,通过使用精确率和召回率两个指标,来准备良好的样本数据。 ·样本数据的制作。通过短周期原型开发评估目标精度,加之专业人士的参与,同时使用高性能的GPU硬件。 ·AI部署人才应具备的技能。AI时代的人才需要福尔摩斯般的思考能力,不仅要善于发现问题,打破现有局面,还要为解决问题设定目标,完成从“知识劳动”到“智能劳动”的转变。 |