![]()
内容推荐 数据,自古就有,人口普查、农业统计、军事战争、政治计算……数据虽小,却有助于治国安邦。美国之所以繁荣鼎盛,数据文化根基牢不可破概是主因之一。 信息爆炸、互联互通、智慧城市时代,大数据,更以排山倒海之势席卷全球,政府施政、企业掘金,大众要公平与正义,大数据被赋予了新的历史使命。 在涂子沛著的《数据之巅(大数据革命历史现实与未来)》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。全书从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景。 “尊重事实,用数据说话”,“推崇知识和理性,用数据创新”,作者不仅意在传承黄仁宇“数目字管理”的薪火,还试图把数据这个科技符号在中国转变为文化符号,形成一种文化话语体系。大数据正在撬动中国的制度创新、科技创新。阅读此书,历史与现实相互融合,知识与激情相互交织,思想与观念相互碰撞,未来与前景必定豁然开朗。 作者简介 涂子沛,江西吉安人,大数据先锋思想家。曾在美国学习、工作多年,2014年从硅谷回国,出任阿里巴巴集团副总裁。从2017年起先后创建涂子沛咨询、数文明科技。同时担任伊斯佳股份(智能制造)董事、人民网独立董事。 其首部著作《大数据》开大数据之先河,被誉为“为华文世界开创了一个重要话题”;第二部著作《数据之巅》则认为必须把大数据从科技符号提升为文化符号,推动中国在大数据时代的全球竞争中胜出。这本《数文明》为数据三部曲的第三部。 本科毕业于华中科技大学计算机系,研究生毕业于中山大学、卡内基-梅隆大学,获公共管理硕士和信息技术科学硕士学位。 目录 推荐序一 进入一个重要的现代文化园地 许倬云 推荐序二 一部精彩纷呈的时代杰作 郭为 推荐序三 大数据可以创造未来 王巍 第一部分 小数据之历史 第一章 初数时代:奠基共和 克服民主的劣势:用数据分权 制度创新:变对抗为合作的魔法棒 两党之争:无法精确分割的权力 亚拉巴马悖论:没有完美的方案 有数初成:共和政治反哺数据文化 中国往事:第一次现代意义上的人口普查 第二章 内战时代:终结奴隶制的灯塔 人口普查:南方最大的敌人 用数据辩论:南北战争的序幕 用数据远征:向大海进军 政治计算:解放黑奴的真正原因 兵家和数据:中国历史上的吉光片羽 第三章 爆发:镀金时代的三重崛起 用数据预测:转变思维方式 总统之死:专业化的悲情序曲 世纪巅峰:大数据驱动的创新 和政治分家:劳工统计的异军突起 姑娘、棉花和数据:究竟谁在推动历史 尘封的瑰宝:中国的数据可视化先驱 第四章 量化:进步时代的数据大潮 用数据决策:水利工程中的数据竞争 冲击量化的极限:给生命定价 “平托”风波:福特公司的道德危机 用数据来审判:理性的必然选择 代理人需要监督:成本收益分析方法的未来 思考中国话题:民族复兴能否量化? 第五章 抽样时代:统计革命的福祉 从选票到电影票:和《乱世佳人》共舞 用数据跨界:质量大师是怎样炼成的 旋转质量的飞轮:日本崛起 世纪之问:日本行,为什么我们不行? 第二部分 大数据的崛起 第六章 开放时代:内开放的历程 内开放1.0:数据承载知情权 内开放2.0:用数据制衡 悲剧现场的一个问题:普查局的数据之痛 LEHD项目:开放数据的使用权 内开放3.0:用数据推动创新 2012年:来自中国的组织创新 第七章 大数据时代:通往计算型的智能社会 世上本没有数:正解大数据 改变世界的三股力量:大数据的成因 有数据,还要有计算:计算型社会的兴起 普适计算:即将到来的超级数据爆炸 数据和计算:第三次工业革命的CPU 数据之巅:通向智能型社会的挑战 第八章 智慧城市:正在拍打世界的浪潮 西方和东方:聪明和智慧 目标锁定“城市平台”:神州数码对话录 众包、众智和众创:让大众解决大众的问题 云、隐私和未来:中国和美国的不同挑战 结语 把握后发优势:把科技符号变成文化符号 后记 蝴蝶振翅 编后记 索引
序言 进入一个重要的现代文化园地 涂子沛先生所著的这部大作,是大数据时代的 应时之作。 他将数据用在管理和研究方面的发展史,以数 据在美国的发展过程作为主要内容。他将美国开国 时期的人口普查作为起点,讨论民主制度如何经过 数据的调查才能发展成为“一人一票”的制度。接 着,19世纪中叶,美国向西开发,美国的工程兵团 进行丈量和调查,使美国的地理状况和疆域都有明 白的依据。20世纪“打孔”计算方法的发明,开创 了后世计算器管理大量数据的技术。到今天,我们 日常生活中,因为计算机和网络的普及,数据无处 不在。以治病为例,要判断疾病的性质或药物的效 果,必须将大量的数据作为诊断和治疗的依据。凡 此,都是数据的应用。 美国的社会愈来愈复杂,在资本主义的国家, 证券交易乃是一桩大事。单单用统计来管理证券, 已经不太够用。最近30来年,许多大证券商为了预 测经济的起落和某一种产业的兴衰,大量地使用不 同产业之间的关系,也顾及国际贸易的情形。这些 私营的企业,几乎都能相当精准地判断市场的情形 。于是,美联储实际上就是美国的中央银行,也必 须更细密地运用许多数据,以掌握经济的全貌,然 后再决定对市场供应的货币是从宽还是从紧。这才 是大数据的*次应用。 中国古代兵书《孙子兵法》就说过:“算则胜 ,不算则不胜;多算胜,少算则不胜。”此处的“ 算”字,就是指如何利用数字估计各种因素。一个 能干的将领打一次战役,要考虑到天时、地利、人 和,这都是可以用数字表现的。但是,一个治国的 领袖,在上述因素以外,还得考虑许多其他的条件 。1942年,日本偷袭珍珠港,以为可以一棒打死美 国。他们没算到,美国工业的实力有充分的再生力 量,三个月之内,美国立刻就能恢复足够的海空实 力。这就是日本军人,他们只知道计算战役,不会 计算战争。到今天,安倍野心勃勃,处处挑衅,他 志在日本复兴。他的计算,大概又是计算自己现在 的兵力和科技能力;他没有算到,自己的原料供应 不够,能源不能自主,人口结构老化:这就是“算 ”得不够。 大数据之“大”,就在于将各种分散的数据彼 此联系,由点而线,由线而面,由面而层次,让人 瞻见更完整的覆盖面,也更清楚地理解事物的本质 和未来的取向。人脑的结构,足够发挥联想力和推 论。在每天的日常生活中,我们时时刻刻在不知不 觉中做大数据的工作,将许多因素综合在一起,作 为行动和决定的依据。只是,一个国家或一个社会 的发展,不能全靠眼睛看得见的一些讯息。有许多 事物,必须依靠全面和长期的发展情况,才能真实 地反映当时一切决定的背景和条件。 今天,信息科学的发展已经能够产生、存储并 实时地分析处理大量的信息,整合多个源头的数据 ,形成全面的多项关系,指出线性的发展方向,引 导我们拥有广阔的视野了。计算机今天处理数据的 能力和速度,已经超过最聪明的个人。可是,使用 计算机的还是“人”,如何驾驭这些数字,还是“ 人”在设计。只是,我们必须要有此认识:今天的 世界,已经千丝万缕,将各地、各种行业、各种条 件,纠缠成一个复杂的全球网络。管理大企业和管 理国家,必须要有足够的信息,了解多种多样的情 况,以全面地理解各种问题及其彼此的关联。即使 是对个人而言,因为越来越多的行为已经转变为电 子化的记录,其生活也变得和大数据息息相关。大 数据这个课题十分重要,我盼望有更多的学者在这 方面写出更多的作品。 涂子沛先生的大作,是讨论大数据较早的中文 作品;在此以前,还罕见讨论数据作为管理方式的 书籍。这本书主要以美国社会中数据的使用为例。 我知道他一心想用这些例子提醒中国的读者:在信 息科学高度发展的今天,我们不能再忽略数据的使 用。涂子沛先生开启了一扇大门,我相信,后面他 会开启更多扇门,让大家进入这一个重要的现代文 化园地。 许倬云 著名历史学家、美国匹兹堡大学历史系荣誉讲 座教授
导语 《数据之巅(大数据革命历史现实与未来)》作者涂子沛开中国大数据之先河,和其首部著作相比,《数据之巅》内容更加丰富,观点更加震撼,堪称作者集大成之作。《数据之巅》将再次掀起全民阅读大数据的热潮。 作者涂子沛是大数据先锋思想家、阿里巴巴集团前副总裁、《大数据》《数文明》的作者。他是中国数据文化的首倡者,提出了把科技符号变成文化符号的理念,倡导数据治国的理论。 数据,是科学的生机和命脉;数据之巅,将带你进入科学的殿堂,开启未来的思索。记住,我们要用数据来说话,用科学来思考。 史学家许倬云、招行前行长马蔚华、中国宽带资本基金董事长田溯宁联袂推荐;神州数码控股有限公司董事局主席郭为、中信银行行长朱小黄倾情解读。 《数据之巅》案例丰富,生动,读起来趣味盎然,又不失科学的风采和素养。 后记 《数据之巅》是在2014年5月初版面世的,全书 以美国为主体,横跨东西方文明,阐述数据文化的 形成、发展和未来。 之所以在《大数据》之后会撰写《数据之巅》 ,这源于作者对数据文化始终不渝的情节。作者在 这本书的题记中写道:“数据文化是尊重事实、强 调精确、推崇理性和逻辑的文化。数据文化的匮乏 ,是中国之所以落后的一个重要原因;建设这种文 化,中华文明的面貌将焕然一新。” 这本书自出版以来,一直畅销不衰,也收获了 很多读者的好评。有读者直言不讳地说:“这本科 普书籍比《大数据》好看不少,尤其是前半部讲美 国历史上关于数据应用的内容,非常具体,大开眼 界。”还有读者评论:“这是一本在数据处理方面 回顾过去、总结经验的历史书,这也是一本眺望远 方、指引未来的方向书。” 还有一位读者颇有感触地写道:“这本书的名 字叫《数据之巅》,而读书的过程,确实让人有种 俯视的感觉。它不仅把数据的本质讲清楚了,更是 把历史的脉络理清楚了。了解历史,对科技人员特 别重要,我国的学术界很容易犯盲目跟风的毛病。 究其原因,就是割裂历史的逻辑,进而拔苗助长、 理论脱离实际。《数据之巅》告诉我们,大数据是 从小数据发展而来的。要想用好大数据,先要理解 数据本身。作为发展中国家,我们对数据的理解还 是不够的,该补的课必须要补。” 当然,除了很多读者对《数据之巅》正面的评 论之外,对这本书也有一些批评之声。有些读者认 为,书的前半部分完全是在讲美国的数据历史,和 中国的关系并不大。其实,作者的意图是,通过梳 理美国小数据的历史,再现历史长河中数据文化如 何形成、数据技术如何兴起、数据治国的理念如何 深入人心的宏伟画卷,进而为中国的数据文化建设 提供一个可以参考的思路。就像罗辑思维创始人罗 振宇所评论的那样:“这本书说的哪是历史?它是 一种思维方式。” 这本书创作于2012—2013年,囿于当时的科技 发展进程,对于一些最新发展的前沿科技没有过多 涉猎。但正如一位读者所说的:“作为一本2014年 出版的书,在当时深度学习驱动的人工智能浪潮还 没有掀起时,能有这样的眼光和见地,相信也是基 于数据分析的成果吧,还是很让人敬佩。” 这次再版,并没有对这本书做大的修订,这里 原因有二:一是,从《大数据》写到《数据之巅》 《数文明》,这一“大数据”系列作品是自成一个 体系的,每本书的侧重点不同。在新书《数文明》 的前言中,作者提到,其前两本书《大数据》《数 据之巅》重点关注的是量数,尤其是《数据之巅》 。《数文明》重点关注的是据数,从量数到据数, 从大数据到数文明,你会发现大数据文化在中国翻 开了新的一页。二是,作者写出来的东西是某个时 期社会发展进程的见证,读者可以清晰地看到作者 的研究脉络,也可以辨识出作者在书中所做出的预 测和判断有多少变成了现实。 看过成龙拍摄的电影《十二生肖》的读者一定 还记得,在这部电影中,成龙使用手套对兽首进行 扫描,扫描得到的数据直接被存储在电脑内,然后 经过3D建模、3D打印,最终一个完美的兽首复制品 展现在观众眼前。虽然现在我们还无法达到那样的 科技水平,但从作者撰写的《大数据》《数据之巅 》,再到刚刚出版的《数文明》,我们看到了一条 清晰可见的大数据发展链条,数据与科技的不断融 合必将给我们带来一种焕然一新的社会面貌。 从互联网、物联网到数联网,大数据催生的商 业应用在不断更新迭代。从人工智能、城市大脑到 单粒度治理,大数据在推动国家治理现代化。相信 在不远的将来,在大数据面前,我们当前的这个社 会将更加公开、诱明、可信。
书评(媒体评论) 涂子沛先生开启了一扇大门,我相信,后面会 有更多的发展,让大家进入这一个重要的现代文化 园地。 ——许倬云 著名历史学家、美国匹兹堡大学 历史系荣誉讲座教授 睁眼看世界的第一人魏源编著过100多卷的划时 代巨著《海国图志》,介绍世界各国的历史政制和 风土人情,试图“师夷之长技以制夷”,使中国从 农业时代进入工业时代。涂子沛先生的大作《数据 之巅》虽然不像《海国图志》一样纵览全球,但在 工业时代向信息时代变迁的转折点,以异国的兴衰 成败警示国人,呼吁以大数据治国理政,其用心是 相通的。 ——李国杰 中国工程院院士 在《数据之巅》这本书中,涂先生跳到了哲学 思考的层面,以统计学的社会应用为切入点,解构 数据文化在美国政治、经济乃至军事发展上起到的 关键作用,一环扣一环,构思精巧,故事生动,逻 辑清晰,读起来实在“解渴”。感谢涂先生的智慧 ,他为时代贡献了一部杰作! ——郭为 神州数码控股有限公司董事局主席 涂子沛先生的《数据之巅》通过追溯梳理美国 的数据历史、展望人类的数据未来,给中国社会提 出了一个数据时代的新命题:如何构建数据文化? 这本书引人入胜、发人深思,是不可不读的好书。 ——马蔚华 招商银行前行长 数据表示的是过去,但表达的是未来,所以观 察数据需要有历史观。涂子沛先生的这本新作《数 据之巅》以大历史、大数据、大社会、大进步的格 局,通过数据将遥远拉近,将悠久缩短,将巨大归 聚,将过程简化。无论你从事何业或研究何题,这 部巅峰之作都值得你认真阅读。 ——朱小黄 中信银行前行长 涂子沛先生《数据之巅》一书的历史高度和现 实意义,超出了他的《大数据》。如果说他上部书 开启了中国人对大数据的认识,此书则从历史的角 度来说明,对数据的理解和掌握是人类文明进步的 标志。 ——田溯宁 中国宽带资本基金董事长 涂子沛先生已经成为中国大数据和数据分析领 域的前沿思想者和专家,如果你想了解大数据的历 史、现实和未来,这本书将是你的常备书目。 ——托马斯·H.达文波特(Thomas H. Davenport) 美国巴布森学院教授,麻省理工学院数字商务 中心研究员 大数据的江湖有两派:国家治理派和产业升级 派。涂子沛先生无疑是国家治理派的宗师,这本书 在美国200多年的政界商海、刀光剑影中勾勒出雄浑 的数据思维、文化、价值观和方法论。 ——吴甘沙 驭势科技联合创始人、CEO
精彩页 第一章 初数时代:奠基共和 让我们建立一个标准,让智慧的人、诚实的人都可以信赖它;其余的事,尽付上帝手中。 ——乔治·华盛顿(1732—1799,美国第一任总统),在立宪会议上的演讲,1787年5月14日 美国是个年轻的国家,其开国至今不过200多年,但数据在其国家生活中的历史,几乎和其建国史相生相伴,准确地说,是和其宪法的制定同步。立宪,解决的是政治体制和权力配置的问题,这听起来和数据风马牛不相及,但美国的建国者在两者之间找到了关系,这就是人口普查。 美国的建国者把人口普查写进了宪法。他们认为,国家权力应该在人口之间平均分配,这个平均,必须用数据来说话。因此,分权之前,需要通过普查把国民数量点算清楚,也就是逐一清点人头。 无论古今中外,每个国家最基本的要素都是其国民和土地,因此,点人头一直是一个国家最基本、最原始、规模最大的社会活动。即使在高度电子化、专业化的今天,要想确切地掌握人口的数量,除了逐一清点,也没有更好的办法。而逐一清点所产生的数据量,对任何一个国家而言,即使按照今天的标准,也是庞大的数据。 200多年前的北美大陆地广人稀、交通不便,点人头的工作必须通过挨家人户问询登记这种原始的方法来完成,其浩大、烦琐和复杂可想而知。 伴随着建国者唇枪舌剑的辩论,普查人员走街串巷、敲门入户地奔波,统计人员对上百万张表格进行手工加总,这个新生的国家拉开了初数时代的序幕。 克服民主的劣势:用数据分权 1787年7月4日,美国费城。 这是美国的独立纪念日,在盛夏酷暑中,美国的立宪会议陷入了僵局。 这时候,距离美国建国,已经整整11年了,独立战争的胜利,也是4年前的事了。英国早已退出北美的统治,但所谓的美国,还没有一个中央政府。国防外交、贸易税收以及13个州之间的州际纷争,都由国会来协调处理。 国会由各州派出的代表组成,其议事原则是一人一票、平等协商,这造成了很多事久拖不决,即使决定了的事,国会也缺乏强有力的执行力。需要建立一个能够号令四方、令行禁止的中央政府,已经成为各个州的共识。但中央政府如何组建?国家权力如何分配?各项职务又由谁担任?这些问题,立宪会议的55名代表已经争论了将近两个月,依然无法达成共识。13个州大小不一,有的坐拥繁华的经济中心,有的地处偏远;实力强大的州当仁不让,认为理应由自己执天下之牛耳,而小州也针锋相对,表示决不充当大州的附庸。 作为大会的主席和主持人,华盛顿充分体会到了这次会议的冗长和艰难。他曾经担任大陆军的总司令,领导美国取得了独立战争的胜利,但这一次,他面临的不是千军万马和刀光剑影,而是围绕观点和利益的思想交锋和口舌之争。在55名会议代表中,有一半以上做过律师,雄辩滔滔,还有25名拥有大批黑奴。因为奴隶制,南方和北方之间已经出现了严重的分歧。 华盛顿深知其中的困难,他的态度是务实、诚恳、平和。会议第一天,他就在致辞中说道:“我们提出的建议和计划,很可能都通不过,也可能激烈的冲突依然存在。但是,如果仅仅为了取悦人民,就提出我们自己都不相信的意见,那我们以后如何捍卫自己的工作?让我们建立一个标准,让智慧的人、诚实的人都可以信赖它;其余的事,尽付上帝手中。”。 经过两个多月的争论,意见和分歧越来越清楚,那就是国家权力如何分配。重中之重是立法权的分配,也就是国会如何构成。 参与会议的13个州中出现了两种大相径庭的意见。一种是弗吉尼亚、宾夕法尼亚等大州主张的两院制:国会由两院组成,一院是上层精英,一院是大众代表,席位都按各州的人口数量分配。他们的理由振振有词:更多的人口应该享有更大的权力。 而另一种是小州主张的一院制,他们认为,各州不论大小,主体一律平等,国会的席位应该在各州之问平均分配。例如,特拉华州就公开声明,自己的人口虽然不及弗吉尼亚州的1/10,但既然以平等之身份结成联邦,在国会就必须拥有相同的席位。 P3-5 |