![]()
内容推荐 从量数、据数、普适记录、人脸识别、以图搜车,到雾计算、城市大脑、单粒度治理、无匿名社会、量子思维……作为中国研究大数据的权威专家,作者涂子沛在《数文明》一书中,以大数据为核心元素,抽丝剥茧,深入地阐述了这个大数据时代的文明社会——一个全新的数文明时代。 将大数据与人类文明融合在一起,这本书提供给我们的不仅是一种全新的叙事结构,它还将突破你的认知边界和思维极限,给你提供一个应对这个世界的全新的认知方法论。 《数文明:大数据如何重塑人类文明商业形态和个人世界(精)》一书从三个层面鞭辟入里地描绘了互联网时代的一种全新文明形态:人类的数据文明——它将是互联网的下半场;商业世界的数据文明——商业世界将迎来重塑和再造;以及个人世界的数据文明——我们该如何从不完整的个体跨跃到高能个体。不论在哪个层面,数文明对人类的颠覆和重构都将是影响深远的。 可以说,《数文明》重构的不仅仅是我们的认知逻辑,还有身处这个数文明时代的生存逻辑——不仅包括每一个国家、每一种社会、每一家企业,还有每一个个体。 作者简介 涂子沛,江西吉安人,大数据先锋思想家。曾在美国学习、工作多年,2014年从硅谷回国,出任阿里巴巴集团副总裁。从2017年起先后创建涂子沛咨询、数文明科技。同时担任伊斯佳股份(智能制造)董事、人民网独立董事。 其首部著作《大数据》开大数据之先河,被誉为“为华文世界开创了一个重要话题”;第二部著作《数据之巅》则认为必须把大数据从科技符号提升为文化符号,推动中国在大数据时代的全球竞争中胜出。这本《数文明》为数据三部曲的第三部。 本科毕业于华中科技大学计算机系,研究生毕业于中山大学、卡内基-梅隆大学,获公共管理硕士和信息技术科学硕士学位。 目录 推荐序一 / 林毅夫 推荐序二 / 孟庆国 前言 从幼稚到成熟:我们这个时代的数据革命 1.数据平权:新商业文明的冲击和原罪 心理入侵:大数据“读心术”诞生了 价格操控:大数据“杀熟”和算法合谋 数惧的最深层:人工智能三宗罪 新经济到底新在哪里:智能商业 金矿如何形成:个人数据的价值困境 数权:互联网原罪浮出水面 2.无匿名追踪:天网的隐喻 要是此案在中国,早破了 三体:天网的真正维度 互联网要向天网学习什么 雾计算:人工智能的竞技主场 以图搜车:追踪亿万车辆之轨迹 硬盘和眼药水为什么同时脱销 3.人脸和人工智能 照片开路:构建身份社会 起步硅谷:几何时代的徘徊 机器能否学习:人工智能之争 “不明觉厉”:深度学习的崛起 数据田径场:政府怎样推动商业创新 历史的意外:“9·11”事件如何拯救失败 无匿名社会:动态识别的前景 4.高清晰社会:单粒度治理和笼中人险境 数纹:迈入高清晰社会 模糊社会的困境 超级档案的产生:单粒度治理 抑制侥幸:中国古代的治国经验 高能个体:人人皆持剑,又皆为剑下人 数据即证据:无侥幸天下 5.数力:普适记录如何“掰弯”人性 唐宗宋祖的烦恼 爱迪生拓宽记录的疆域 尼克松之困:白宫录音小史 特朗普的录音风波 视频直播为什么低效 普适记录:上帝的终极武器 6.数文明:社会、商业和个人如何被记录赋能 一个新的发展视角:记录 历史上中国文明领跑与掉队的原因 三本书在三个大陆的三种命运 十计九记:商业文明的进步密码 电梯里的羞辱 全面记录全面计算:开创数文明时代 7.数据新政:建设现代国家的治理体系 数基:世界级创新和本土难题 数联网:数据维度上的整体性政府 城市大脑:新时代的南京长江大桥 仅此一次:“最多跑一次”如何升级 开放摄像头:天网的未来 对数据和算法的现代治理 8.人工智能的边界、风险和未来 一切皆可预测:拉普拉斯之妖 量子思维:不确定的现实 人是城市中的粒子:测不准 数据相对论:普适记录的极限 表情分析:人工智能的边界 转型智能社会:怀揣瓷器花瓶,进入花花世界 结语 第四次浪潮:我们如何再次领先 后记 野路无人自还 大事记 索引
序言 数据自古有之,在互联网出现、普及之后,因 为数码化而记录、积累成为可供计算机快速提取、 分析的大数据。近几年来,它被广泛地运用于人类 社会的生产、生活、管理和社会治理,成为并列于 资本、劳动和自然资源的新的要素禀赋。 这一新禀赋的出现对世界政治、经济、文化的 影响将不亚于15世纪末美洲新大陆的发现,值得社 会各界认真研究和关注。 我国虽然起步晚于美国等发达国家几年,但是 由于人口规模、经济体量和快速的发展,在大数据 这一禀赋及其开发运用上相比于世界上其他国家具 有比较优势,并且已经涌现了百度、阿里巴巴、腾 讯、今日头条等世界前沿的领先企业和众多的独角 兽公司,党和政府 也正式提出了“国家大数据战略”,先后出台 了《促进大数据发展行动纲要》《大数据产业发展 规划(2016—2020年)》等指导性文件,大数据的 开发、运用正处于方兴未艾的阶段。 这本《数文明》为大数据先锋思想家涂子沛所 著的第三本力作,分享了他对大数据给人类、社会 和文明的各个层面可能带来的机遇和挑战的探索和 思考,纵横历史、文字隽永、深入浅出、信息量大 、涉及面广,读之获益甚多,难以释卷。 作者预言了数据经济时代的到来,其观点独到 ,具有前瞻性。毫无疑问,大数据将成为全球经济 的重要组成部分,其对中国经济的赋能作用也将日 益凸显,但作者也提出,它也可能给经济社会投下 阴影。如何发挥大数据的正向作用、限制其负面影 响,我希望看到更多的研究和讨论。 林毅夫 北京大学新结构经济学研究院院长 世界银行原高级副行长、首席经济学家
导语 涂子沛著的《数文明:大数据如何重塑人类文明商业形态和个人世界(精)》是一本从经济学视角解读大数据与人工智能的经济类图书。在完成农业、工业、服务业革命之后,人类开启了一场由人工智能“加持”的数据革命。我们进入了一个普适记录的时代,用来记录数据的设备越来越多,数据量越来越庞大。作为《大数据》和《数据之巅》的续作,本书提出:大数据=量数+据数。“据数大爆炸”引发了我们在商业发展、社会治理、个人生活领域的巨大变革。大数据所催生的互联网应用仍在不断更新迭代,当大数据完全发挥出它的潜力时,其最终形态将是“全自动商业”,或称“智能商业”,商业文明将被重塑和再造。大数据比你更了解你自己,甚至能改变你的决策?你能意识到数据隐私的价值吗,你要继续为大公司无偿贡献数据吗?大数据互联网公司如何兴起,又将如何迎来拐点?新的社会和文明将怎样在数据赋能下演进,又将如何遭受数据的围攻?对这样一些问题,你在本书中将找到答案。 后记 野路无人自还 这是继《大数据》《数据之巅》之后,我关于 数据的第三本书。和前两本书相比,我尝试引入一 些变化。 一是视角变了,前两本书都是在留美期间写的 ,更多的是从世界看中国,本书提笔之时,我已经 回国工作三年,做过了企业高管,也开启了自主创 业,已接上国内地气,这本书是我立足中国的变化 ,对当下发展趋势和改革方向的思考。 二是在读了8年多的英文书之后,我开始重新翻 阅中文书,特别是历史经典,我希望从传统的中国 智慧中获得启发,希望不仅用中国的语言,还要用 中国的智慧阐述现代的问题,并提出解决方案。 例如写到量子力学时,陶渊明这两句诗跳入了 我的眼帘:“人生无根蒂,飘如陌上尘。分散逐风 转,此已非常身。”这是《杂诗十二首》第一首的 开头。靖节先生的大意是:人生在世就像漂泊在路 上的尘粒一样,四处分散、随风飘转,此身历尽艰 难,已非原来的我了。这启发我想到,现代人就是 城市中的粒子,他们像粒子一样互相作用,人类社 会更适用量子力学,人也像微观世界的粒子一样“ 测不准”。 又如写到人脸识别时,我追溯了中国古代画工 的历史。西晋文学家傅咸(239—294)曾经专门作 《画像赋》,他概括说,贵族之所以要画像,是“ 惟年命之遒短,速流光之有经,疾没世而不称,贵 立身而扬名”,即其根本目的是对抗遗忘、存名后 世。也就是说,最早的绘画也源于和文字几乎一样 的目的:记录。这在东方和西方是一样的。 说记录是人性的需要,其实也不为过。 本书的第三个变化,是需要面向未来,回答诸 多前沿的问题。例如,由于深度学习的提出,最近5 年人工智能取得了巨大进步,但人工智能是不是还 会出现新的方法?深度学习是向数据学习,智能是 用数据喂出来的,如果有一天,机器能够向书本学 习,它会不会更接近于人?又如,人类的驾驶员会 出交通事故,医生可以有、也肯定有误诊,为什么 我们就不能允许自动驾驶出事故,不能接受人工智 能有误诊呢?再如,人工智能的发展是不是也有边 界?人类拥有一些无法言说的隐性知识,它们很难 被规则化、语言化,用文字、数据都无法有效表达 ,这也是为什么医生年纪越大越值钱,因为隐性的 知识只跟时间、年龄和经验的积累有关,它们难以 言表,因此也难以传承。那问题便是,在数文明之 外,未来又会不会出现新的文明形态? 在算法、机器智能大幅跃进,向人类逼近的同 时,人类的生活却越来越程式化,在向机器靠拢。 20世纪30年代,喜剧大师卓别林曾经创作《摩登时 代》,塑造了一个因为在流水线上整天重复拧螺丝 钉而异化的工人形象。大部分人没有意识到的是, 手机也是一台设备,它也有流水线,软件就是它的 流水线,但这条流水线在云端,是不可见的。如果 说工业社会的异化只影响了流水线上的工人,那数 据社会的异化正在波及几乎每一个人。今天,无论 是在机场地铁、街头路口,还是办公室、客厅、卧 室,我们无时无刻不在看手机,而且也在重复一两 个动作:滑屏和点击。 就人的本性而言,我赞同人工智能先驱明斯基 的看法,大部分人在大部分时候就是一台机器。因 此,人工智能只要达到人类的“平均智能”,就可 以在很多场合代替很多人,而人工智能超越“平均 人”仅仅是时间的问题。 但人工智能是否能为普通人所用呢?例如,把 芯片植入我们的大脑,让我们可以快速调取各种各 样的信息,人类就可以像机器人“沃森”一样回答 各种各样的问题,那“平均人”的水平是不是会大 幅提升,变成“增强人”?这种方法会奏效吗?人 类的创造力会不会因此增强? 此外,算法正在把很多事情都变成数据进行匹 配,算法的普及减少了整个社会的随机性,生活更 经济了,但是不是更美好了,我们也不得而知。再 如,整个社会因为数据而形成了一个强关联的系统 ,但这个系统又存在大量的漏洞,智能社会是更脆 弱还是更稳健? 这些都是在人类现有的知识边界凸现的新问题 ,本书就是在尝试回答这些问题。 很多个深夜,我一人在书房徘徊,或独坐在电 脑面前,一遍遍校正自己的逻辑和基点,这时候, 我的脑海中会反复回响起南唐李煜的一首词:“心 事数茎白发,生涯一片青山。空山有雪相待,野路 无人自还。” 这首词描摹的是一个在雪山和野外徘徊的独行 人,字词之间透着一股冷寂和无奈。我写作期间, 突然意识到这个古代的独行人就是今天的一个创新 者,这种冷寂无奈就是人类的创新之苦。创新就是 要向边界和边缘突进,那里大雪满山,也可能是空 山,你徒手攀登,可能空手而回;那里是无人区, 你必须在无人区思考、徘徊、拓进,这种冷寂和孤 独是常人难以忍受的,只要是人,在无人区就待不 久,因为寂寥和寒冷,我们只能半路折返回来,所 谓“野路无人自还”。 但这不要紧,一个人只要向前突破一点点,就 是对人类文明的贡献。文明的进步从来都是这样产 生的。 回答新的问题,就是创新,这 书评(媒体评论) 这本《数文明》为大数据先锋思想家涂子沛所 著的第三本力作,分享了他对大数据给人类、社会 和文明的各个层面可能带来的机遇和挑战的探索和 思考,纵横历史、文字隽永、深入浅出、信息量大 、涉及面广,读之获益甚多,难以释卷。 ——林毅夫 北京大学新结构经济学研究院院 长 世界银行原高级副行长、首席经济学家 《数文明》是一本应时力作,这本书提出了很 多富有启发性的概念,体现出涂子沛先生对数据文 明的深邃思考和敏锐洞察。作者纵横古今,关联西 东,许多观点和内容富有思想性,引用的案例生动 鲜活,可读可鉴性很强,阅读时让人几乎不愿跳过 任何细节。 ——孟庆国 清华大学公共管理学院教授 清 华大学国家治理研究院执行院长 知识的力量有三个层级,我将其概括为知识获 取、知识转化、知识赋能。从涂子沛先生的个人经 历以及他对大数据的研究、布道和推动中,我也看 到了这三个层级。我相信这本新书不仅可以启迪思 想,还将为读者在大数据时代获得个人成功赋能。 ——罗振宇 “得到”App创始人 大数据驱动了澎湃的商业创新,但数据之光也 在新商业文明的晨曦中投下了阴影,在这本新书中 ,子沛从数据的角度回顾了商业文明的过去,检视 了新型智能商业模式中潜伏的凶险,并将发源于商 业的数据革命推及社会治理的广度和人类文明的高 度,给人启发,入木十分。 ——吴晓波 知名财经作家 这是一本深刻阐述人类记录之文明史、系统描 述大数据未来发展前景的好书。 ——毛光烈 浙江省智能制造专家委员会主任 人工智能专家委员会副主任 这是涂子沛数据三部曲的第三部。相较于《数 据之巅》,《数文明》把大数据从国家治理的层面 上升到了人类文明的高度。中国传统的理论认为国 家治理既需要德治,也需要法治。子沛在这本书中 提出了“数治”的理念,数据将重塑人性、文明和 天下。这本书聚焦对未来大格局的思考,闪耀着诸 多智慧的亮光。 ——田溯宁 中国宽带资本基金董事长 这本书创造了一个大数据的新话语体系,从据 数、数惧和数权,到数纹、数力和数体,再到数基 、数明和数治,涂子沛先生用好看的故事、严谨的 逻辑和富有人性的哲理编织出了一个新文明的愿景 ——数文明。作者四年磨一剑,用“野路无人自还 ”的孤独,换得了大众数智的开启。 ——吴甘沙 驭势科技联合创始人、CEO
精彩页 大数据和心理学相结合竟然爆发出如此大的威力。研究人员通过实验发现,通过社交网站的数据可以判断一个人的心理特质,其判断结果甚至比调查访谈这个人的亲朋好友还要准确。 也就是说,只要有足够的社交数据,不用任何人为的介入,计算机和算法就可以自动判别一个人的心理特质,甚至仅仅凭借“点赞”数据就可以完成,因为没有无缘无故的爱,每一个“点赞”背后都有原因。如果掌握一个人在’Facebook上的10个“点赞”,算法对他的了解就可能超出他的普通同事;掌握70个就可能超过他的朋友;掌握150个就可能超过其家庭成员;掌握300个就可能超过其最亲密的妻子或丈夫。 剑桥分析公司在这条路上走得更远。他们把8700万人的社交数据和美国商业市场上2.2亿人的消费数据进行匹配、组合和串联,找出谁是谁,然后就性别、年龄、兴趣爱好、性格特点、职业专长、政治立场、观点倾向等上百个维度给选民一一打上标签,进行心理画像,建立心理档案,再通过这些心理档案开展分析,总结出不同人群的希望点、恐惧点、共鸣点、兴奋点、煽情点以及“心魔”所在。 当代大数据“读心术”就此诞生了。 掌握了一个人的“心魔”,就可以评估一个人最容易受哪种信息的影响,就可以知道信息该如何包装、如何推送,才能搔到接收者的痒处,潜移默化地影响一个人的选择和判断。 回到特朗普的选举上:对义愤填膺的爱国者,可以推送“鸡血”文章,号召他们保卫美国,告诉他们特朗普能让美国重新伟大;对知识精英,则推送包装得比较温和的、理性的、显得高深的分析,以获得他们的共鸣;对倾向于特朗普但又不愿意捐款、不愿意出门投票的人,就告诉他们特朗普面临着严峻的挑战,希拉里上台后果将会非常惨痛,鼓动他们出钱出力;对民主党的支持者,则大量推送和希拉里家族有关的负面信息,让他们对希拉里失望;而对那些容易被煽动起来的网民,就推送各种耸人听闻的阴谋论和“标题党”内容,进行情绪刺激和情绪强化。 当然,很多推送的信息是被精心修饰过的事实,有些甚至是由专门的团队为特定细分群体“炮制”出来的虚假消息,但这些消息迎合了人性的需求,直达人类心理的最深处,而且算法绝不会推送观点相反的信息,接收者将会沉浸在一种氛围当中,质证、怀疑的可能性因此大大降低。 相同的配方,熟悉的味道,这些精准投放的宣传资料,就好像一颗颗用数据调配的药丸,被推送给选民反复服用,之后慢慢地发生作用,最终引导选民做出药丸配制方预设的政治行动。 从本质看,这是互联网的精准广告投放技术在选举中的应用。 现代广告业已经有上百年历史,它和心理学的发展紧密相关。从20世纪头10年开始,广告商就采用统计分析的方法研究如何编辑、呈现信息,希望以情动人、感召大众掏出钱来。这个过程就好像爱迪生为了找到灯丝的最佳选材,连续做了1600多次试验,最终发现了钨丝一样,广告商通过不断试错发现了组织、呈现信息的最佳配方。心理学已经证明,人类虽然有理智,但人性中有很多“漏洞”,人类大部分时候都会被情感左右,一些简单的伎俩就可以影响、操纵人类的情感。经过100多年的研究,广告业对人性弱点的洞察已经炉火纯青,诺贝尔经济学奖得主阿克洛夫(George A.Akerlof)将这种利用人性“漏洞”的广告称为“钓愚”。 互联网从两个方面大幅提升了传统广告的效率。 一是以A/B测试的迭代方法加速寻找最佳的“钓愚”配方。 假设一个电商平台有100万个用户,如果它要推出一件商品的特定广告,可以推出两个不同的设计版本,然后在两个用户群中进行实验。假设其中50万用户看到版本A,产生了10万购买;另外50万用户看到版本B,产生了12万购买,这就说明版本B的转化率更高,通过控制平台,它可以迅速将版本B推送给所有用户。 广告的版本当然不止A、B两种,其版本的变化有很多维度。拿标题举例,是长标题还是短标题,是疑问句还是陈述句,是正式语气还是非正式语气,是强调卖点A还是强调卖点B,效果会大不相同。即使是同一组文字,其字体、粗细、大小、颜色、背景的不同也会给浏览者不同的感受。再比如布局,是横幅还是多列,是大图片还是小图片,是手绘图还是实景照等,其中有近乎无数的变化。这意味着A/B测试的过程可以不断重复、优化,直到无法进行任何新的改进,到这个时候,一个趋近于完美的“钓愚”配方就出现了。一旦推出,它就将带来最高的点击率和购买率。 要调整、追踪、对比这样上百个维度的变化,对人类来说很难完成,但这恰恰是人工智能擅长之处。算法不仅能记录每一次变化以及每次变化的效果,而且可以自动地调整、推送这些变化,在上百万人的大规模人群中不断重复这项工作,其细致之处,人类难以企及。 P8-10 |