网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大数据和我们
分类 人文社科-法律-法律法规
作者 (美)安德雷斯·韦思岸
出版社 中信出版社
下载
简介
编辑推荐

数据是未来的新石油;

风靡斯坦福大学的社交数据革命课;

首席科学家、大数据专家心血力作;

简体中文版全球同步上市。

阿里巴巴、谷歌、脸谱网、沃尔玛、桥水基金正在应用的数据挖掘和机器学习技术,后隐私经济时代的全新游戏规则。

安德雷斯·韦思岸所著《大数据和我们》讲述,社交数据的革命使之前从未量化或无法量化的一切事物都能被量化。当我们有能力对世界上一切事物的数据进行挖掘,在透明性与主动性方面行使我们的权利时,我们的数据将服务于我们。

内容推荐

每当我们在谷歌上搜索某个问题,在脸谱网上跟某人互动,用优步打车去某处,甚至打开一盏灯时,我们都在产生和分享社交数据。无论是被动还是主动分享的数据、强制还是自愿分享的数据、精确还是粗略的数据,社交数据的总量呈指数增长趋势。

在此背景下,数据科学家化身侦探与艺术家,通过人们留下的电子踪迹为他们绘制出越发清晰的行为素描画,发现人们的偏好或倾向,以及预测人们可能会购买何种商品。

银行通过数据来评定我们的信用等级,保险公司通过数据来评估我们的风险水平,雇主通过数据来决定是否雇用我们,但作为个体,我们却并未充分受益于数据财富。

我们每天都会做出很多决定,我们今天的行为方式可能会影响我们今后几十年的选择,但很少有人能在短期或长期内观察到自己的所有行为或分析出这些行为将产生何种影响。随着我们逐渐认识到社交数据的价值,作者认为我们的生活不应由数据来驱动,而应让数据为我们的生活服务。

在这个时代的转折点上,人们正在定义创建数据的人与把数据转化成产品和服务的组织之间的关系。不仅游戏规则发生了改变,这个新游戏还要求我们重新界定客户与零售商、投资者与银行、雇主与雇员、患者与医生、学生与老师、公民与政府之间的关系。在安德雷斯·韦思岸所著《大数据和我们》中,作者总结了自己多年来在商业、教育、医疗、旅游和金融领域做咨询的经验,并在此基础上提炼出大数据如何更好地服务于普通大众的观点。

目录

序言 当你的一切都被记录在案时

引言 社交数据革命

第1章 培养数据素养

 数据挖掘的力量

 你的数据有什么价值?

 老虎机与挑剔的相亲者

 通过机器学习发现错误

 用数据模型辅助决策

 实验!实验!实验!

第2章 数字身份与真实身份

 隐私权简史

 从密不透风到公之于众

 在互联网上,所有人都知道你是谁

 使用假名的利与弊

 真实的信号

 隐私权和责任心不可兼得

第3章 社交图谱与信任系数

 大数据时代的人际关系

 “动态信息”功能与“分享所爱”计划

 为拥有数据的人提供服务

 社交数据的影响力有多大

 信任的价值

 建设积极的决策环境

第4章 传感器数据大爆炸的时代

 如何充分挖掘传感器数据的价值

 雇用私家侦探的做法过时了!

 人工智能时代的读心术

 特克斯勒消逝效应与专注力

 一次杜撰出来的“度假之旅”

第5章 计算隐私效率与数据回报

 用户访问自己数据的权利

 用户检查数据挖掘过程的权利

 用自己的数据投票

第6章 让数据为你服务

 拥有修正数据的权利

 拥有对数据进行模糊处理的权利

 拥有用数据开展实验的权利

 拥有自主导入和导出数据的权利

 人类擅长的事和机器擅长的事

第7章 把未来创造出来

 按照你自己的需求购买产品与服务

 金融的未来

 公平的职场

 在数字课堂上学习

 精确地界定我们对数据的需求

 决策的量化

后记 走出洞穴,沐浴阳光

致谢

试读章节

加利福尼亚大学旧金山分校的心理学荣誉退休教授保罗·艾克曼(Paul Ekman)一直在研究6种基本情感的生理效应。这6种情感分别是生气、伤心、害怕、蔑视、惊讶和愉快。艾克曼让来自5个不同国家(智利、阿根廷、巴西、日本和美国)的人看这6种情感状态的照片,并观察他们有何反应。他预测文化环境的不同会导致人们的反应各异,但结果证明他错了。这个实验重复了许多次,他发现人们在看照片时都会产生相同的表情:与生气相关的是眉头紧锁,眉毛和嘴角下垂表示看到的是伤心的照片,皱鼻子表示蔑视,与真诚笑容相关的是眼角纹。(礼节性假笑——因为泛美航空公司的乘务人员总是面带这种笑容,因此又被称作“泛美式微笑”——往往只有嘴部有变化。)1978年,艾克曼与他的同事华莱士·弗里森(Wallace V. Friesen)通过总结他们观察到的所有表情,建立“面部表情编码系统”(FACS)。根据FACS,几名机器学习研究人员开发出了人脸识别软件。

艾克曼假设,情感具有普遍性,因为情感是反映我们的心理状况和彼此关系的真实信号。随着实地研究与实验的进行,他发现每种基本情感还与其他生理指标有关,例如心率、呼吸率、血流量和肌张力等。有时,人们的情感变化非常快,如果不注意,甚至难以捕捉到情感变化的过程。这些“微表情”常常意味着这个人不想表露自己的情感,或者他没有意识到自己的这种情感。由于这些表情稍纵即逝(持续时间大约只有1/5秒),没有经过专业训练的话,是很难发现的,需要借助回放视频才能看到。

艾克曼曾经在圣迭戈一家名叫Emotient的公司担任顾问,该公司开发出了可以从摄像头记录的原始数据中实时识别情感的软件。2007年,Emotient公司推出的第一个商业应用程序是 “笑脸检测程序”,可以安装到索尼数码相机上。当取景框里的人露出笑容时,该程序会立即抢拍。随着Emotient公司的算法不断进步,一台高清照相机就可以监控同处一室的400人),同时“读取”他们脸上的微表情。该公司还打算将这款软件推广到医学疗域,用于捕捉患儿脸上的痛苦表情。事实上,研究表明,在捕捉身体不适的真实信号这个方面,计算机强于人类。Emotient公司与谷歌早期合作开发的一种眼镜应用程序被推销给公司管理者,帮助他们了解员工的精神面貌,以及情感对顾客购买行为(买什么?从谁那儿买?)的影响力。2016年1月,Emotient公司被苹果公司收购。

伦敦的Realeyes公司也引进了艾克曼的研究成果,以评估人们在看到广告视频时的面部表情。广告显示屏可能是某个人的电脑显示器,也可能是安装在公共场所的显示屏。电子产品生产商LG开展的“舞台恐惧症”广告活动就以男厕所为广告背景。厕所的小便池上方装有LG显示器,当有男子来小便时,屏幕上就有一名女子把广告推开,摆出一副能看见男子小便的姿态。据Realeyes面部表情分析摄像头的观察,这些男子的表情由困惑、害怕变成高兴。分析结果甚至表明,有一部分男子在视频开始和结束时都表现出厌恶的情绪。麻省理工学院媒体实验室情感计算小组找到Affectiva公司,合作研发可以帮助孤独症患者解读他人面部表情的情感警报系统,从而与Realeyes公司形成了竞争关系。商业客户请Affectiva公司检测人们对广告视频的情感反应,民意调查公司则用它来统计电视辩论期间政治候选人的支持率情况。

P155-P157

序言

如何确保数据会为我们服务?

每一场革命最初都是一个人头脑中的一种思想,一旦同一种思想在另一个人的头脑中出现,它对于这个时代就变得至关重要了。

——拉尔夫·沃尔多·爱默生(Ralph Waldo Emerson)

早晨6点45分,手机闹钟将我叫醒。于是,我拿起手机,一边浏览电子邮件与脸谱网信息,一边走进厨房,我美好的一天就此开始。手机上的全球定位系统应用软件会记录我的位置变化,并显示出我向东、向北移动了几米。我给自己倒了一杯咖啡,然后走出厨房。这时,手机上的加速计会给出我的行走速度,气压计会记录我何时上楼。由于我在手机上安装了谷歌的应用程序,因此谷歌公司拥有我的这些数据的记录。

吃完早饭后,我要去斯坦福大学上班。在我关灯并拔下移动设备的电源插头后,电力公司安装的“智能”电表就会知道我的用电量开始下降了。当我打开车库门时,电表会探测到与之相匹配的使用签名。当我开车上路时,电力公司已拥有足够的数据断定我已不在家中。当我的手机从另一个基站接收信号时,通信公司也知道我出门了。

驾车行驶在路上时,如果我闯了红灯,安装在街道拐角处的摄像头就会拍下我的车牌号。谢天谢地,我今天遵纪守法,不会收到交通罚单。但在行驶过程中,我的车牌会多次被拍摄。有些摄像头属于当地政府,有些则属于私营公司,它们通过分析数据了解人们的驾驶习惯,并将此作为产品出售给警方、开发商及其他利益群体。

我到达斯坦福大学时,会使用手机上的“无忧停车”应用支付停车费。停车费自动记入我的银行账户,同时学校的停车管理小组会收到我的付款通知,这样一来,校方与我的开户银行都知道我在上午9点03分到达校园。由于我的手机不再以汽车的行驶速度移动,谷歌公司会推断出我已停车并记录下我的位置,以便我日后查询当时的位置记录。我也可以通过美国车险服务商Metromile公司的保险应用查询我当时所在的位置,这款应用通过我的车载诊断系统实时记录我的驾驶数据。这让我可以立刻发现今天的汽车燃油效率较低——每加仑汽油行驶了19英里,我此次通勤花了2.05美元。

上完课后,我打算和旧金山的新朋友见个面。我们在“虚拟世界”中见过面,当时我们共同的朋友在脸谱网上发了帖子,我们都对它进行了评论,也很赞赏对方的看法。之后,又发现我们在脸谱网上有30多个共同好友,所以我们确实应该见一面。

谷歌地图预计我将在晚上7点12分到达目的地。与往常一样,它的预测误差只有几分钟。这位朋友居住公寓的一层是一家销售烟草产品和吸食大麻器具的商店,而我的智能手机上的全球定位系统应用软件无法区分公寓和商铺。我的车载导航与谷歌导航都告诉我,我今天晚上去了一趟毒品商店——这是我上床前查阅第二天的天气预报时,谷歌广告推送告诉我的。

这不只是一场社交数据革命。

将欲取之,必先予之

每天都有10多亿人像我这样产生和分享社交数据。社交数据是有关你本人的信息,例如你的运动、行为、兴趣,以及你和其他人、地点、产品,甚至意识形态之间的关系。其中有些数据是在你本人知情的前提下自愿分享的,例如在使用谷歌地图时登录并键入目的地;其他数据则并非如此,你经常会在不经意间就分享了自己的数据,这是享受互联网与移动设备所带来的便捷性过程的重要部分。显然,在某些情况下,分享数据是你获取服务的必要条件:如果你不向应用软件提供你当前所在的位置和目的地,谷歌公司就无法为你找出最佳的行车路线。在某些情况下,你可能很乐意提供信息,例如你给某个朋友在脸谱网上的发帖点赞或在领英网上对同事的工作表示肯定,以表明你愿意以某种方式鼓励和支持他。

社交数据有时可以做到比较精准,能将你的位置精确到1米之内。但是,在通常情况下,社交数据都很粗略,有时也不够完整。例如,除非我登录可以显示家中智能电表读数的某个应用(比如,为了查看我在去机场之前是否将家中所有的灯都关上了),电力公司才能知道我何时离家,但也仅限于此。这种数据过于粗略,也许对我没有太大的帮助。与此相似,我在拜访旧金山的那位新朋友时,虽然社交数据可以准确地显示出我所在位置的经度和纬度,但对我当晚活动的推测却是完全错误的。有时候,虽然数据看似十分精确,但在很大程度上这是数据解读的结果。实际上,社交数据本身是非常粗略的。粗略的数据很可能不完整、易出错,有时其中还会掺杂欺诈数据。

无论是被动还是主动分享的数据、强制还是自愿分享的数据、精确还是粗略的数据,社交数据的总量呈指数增长趋势。如今,社交数据总量翻一番所需的时间只有18个月。在未来5年内,社交数据总量将增长约10倍,或者说增长一个数量级;在未来10年内,社交数据总量将增长约100倍。换言之,2000年全年产生的数据总量目前只需要1天即可完成。以这样的增长速度计算,预计到2020年,不到1个小时就能产生等量的数据。

要知道,“社交数据”并非仅适用于社交媒体的流行词汇,这一点很关键。许多社交媒体平台的设计旨在进行播报,以推特为例,沟通几乎总是单向进行的,由名人、权威人士或营销人士向公众传播信息。社交数据更加民主化,你可以通过推特或脸谱网分享你的信息、所在公司的信息、你的成果、你的看法,但你的电子踪迹比这些更深远。根据你在谷歌网站上的搜索记录、你在亚马逊网站上的购买记录、你在讯佳普(Skype)上的通话记录、你手机的实时定位,再将这些信息与其他多种渠道相结合,就能得出有关某个人的一幅独特的“肖像画”。

此外,社交数据不会止于你本人。在你展示自己通过与亲朋好友、工作同事的沟通建立起的亲密关系时,你便创建并分享了数据。你所创建的社交数据不仅涉及友人,也会涉及陌生人,例如你在评价某件商品或在照片墙(Instagram)上传照片时。空中食宿(Airbnb)是一个租用房间或套房的应用平台,你若要注册账户就需要验证身份——不仅要使用政府核发的身份证,还要使用你的脸谱网账户。社交数据正在嵌入你家中的智能温度计、汽车的导航系统以及职场的办公软件,并开始成为教室与医院诊疗室中的亮点。随着手机配备了越来越多的传感器和应用,它们可在我们的家中、商场或单位里跟踪我们的一举一动。你将越来越难以掌控有关你日常活动的数据,甚至包括你内心中最隐秘的愿望。数据科学家将化身为侦探与艺术家,通过人们留下的电子踪迹为他们绘制出越发清晰的行为素描画。

通过检查并提炼这些电子踪迹,可以发现人们的偏好或倾向,还能做出预测,例如人们可能会购买何种商品。在我担任亚马逊公司首席科学家期间,我与杰夫·贝索斯共同制定了该公司的数据战略和以客户为中心的文化。我们开展了一系列实验,比较网站编辑或消费者所写的商品评论中哪一种会让客户更开心,并观察依据传统的人口统计信息或个人点击情况为客户做推荐是否成功率更高。在举办厂商赞助的促销活动时,我们发现真正的沟通可以爆发出巨大的力量。我们为亚马逊开发个性化工具,使人们做出购买决定的过程及所购买的商品都产生了根本性改变,并且成为电子商务的标准。

离开亚马逊之后,我在斯坦福大学和加利福尼亚大学伯克利分校为成千上万的本科生和研究生开设了社交数据革命课程,还在中国上海的复旦大学与中欧国际商学院、北京的清华大学教授这门课程。我同时继续经营社交数据实验室,成员是我在2011年结识的一群数据科研人员与思想领袖。在过去10年里,与我合作的公司包括阿里巴巴、美国电话电报公司、沃尔玛、美国联合健康保险集团,以及一些大型航空公司、金融服务公司、交友网站。我积极倡导把数据的决策权与客户或用户分享,他们是与你我一样的普通人。

没有人能够独自处理当下的所有数据并做出明智的决定。但在让数据服务于我们的需要和解决问题的过程中,谁能够获得必要的工具呢?从这些数据中分析得出人们的偏好、倾向和做出预测后,是将其提供给少数强大的组织,还是提供给所有人使用呢?使用社交数据所需支付的费用是多少呢?

随着我们逐渐认识到社交数据的价值,我相信我们的重点不仅是获取数据,还必须采取某些行动。我们每天都会做出很多决定,而有些决定一生中只会做一次。但是,这并不意味着今天产生的社交数据的寿命很短。我们今天的行为方式可能会影响我们今后几十年的选择,很少有人能在短期或长期内观察到自己的所有行为或分析出这些行为将如何影响自己。社交数据分析有助于我们找出各种可能性,但必须经过深思熟虑方可做出最终选择。

毕竟,这些科技无法了解我们每个人乃至整个社会对未来生活的憧憬。许多国家都出台了法律,保护个人在就业或医疗方面不受歧视。未来某一天,这些法律或许将不复存在(在某些国家,直到现在也没有这样的法律)。假设你希望获得有关减肥和锻炼的建议,于是你决定在医疗应用或网站上表达自己对胆固醇过高的担心。这样做会不会对你不利呢?如果法律规定,在医生向你告知健康风险并推荐健康的生活方式之后,你仍然不愿意放弃吃油炸食品,依旧喜欢瘫坐在沙发上,就可以依法对你收取更高的医疗费用,你怎么办?如果你的主管利用某种服务软件在网上查找有关你的信息,他可能认定你的生活方式不适合在他的公司任职,从而拒绝考虑你的求职申请,你怎么办?这些都是实实在在的风险。

如果这些数据是你独立创建并透露出去的,那么,一旦察觉到风险,你或许可以停止这种行为。这会给你带来许多不便,却是可行的。但是,人们对有关自己的许多数据并没有掌控力。由于社交数据被公司和政府用于改善结果、提高效率,因此我们更不可能掌控这些数据。

社交数据关乎社会大众,我们每个人都需要考虑怎样做才是最好的数据利用方式。科技正在飞速发展,收集和分析数据的公司主要从事信息的产出与编码,并不负责制定原则。即使它们考虑那些原则性问题,也仅仅是因为业务需要而临时为之。对人类未来会产生重大影响的原则性问题的决定权,绝不应该交到数据公司手中。

我们可以允许对所有这些数据进行收集、合并、汇聚、分析,以便能在决策过程中更好地做出取舍。取舍是任何重要决策的必要组成部分,在做取舍时,人的判断十分关键。我们的生活不应由数据来驱动,而应让数据为我们的生活服务。

后隐私时代的原则

我们已经认识到数据在生活中发挥着越来越重要的作用,也已经采取了许多措施保护自身的利益。20世纪70年代,美国与欧洲针对信息的公平使用采取了大体相似的原则。人们有权知道谁在收集自己的数据以及这些数据的使用情况,当发现数据不准确时,还可以要求修正数据。然而,对于今天的新型数据来源与分析方法,这些保护措施要么过于严厉,要么过于无力。

之所以说它们过于严厉,是因为这些措施都想当然地认为可以对收集到的所有数据添加标签。亚马逊公司可能会以浅显易懂的术语,准确地解释它是如何使用收集到的个人信息的,它甚至能用这些信息帮助人们做出更明智的决定。但是,对这些信息进行审查需要大量的时间。我们中有多少人会花时间对所有的相关数据进行核查呢?查阅亚马逊公司怎样对每个数据点分配权重,会给你带来什么好处,还是说你宁愿亚马逊交给你一份数据使用简报呢?

之所以说这些保护措施过于无力,是因为即便你能够核查你创建和分享的所有数据,你也无法全盘掌握你的所有相关数据,因为这其中包括其他人创建和分享的关于你的数据,包括你的亲朋好友、同事、老板。你在网上访问的公司和你在实体世界中访问的大部分公司也会产生(有时也会分享)关于你的数据。你在街上遇到的陌生人以及和你打交道的其他许多公共组织和私营组织,同样如此。谁来判定这些数据的准确性呢?今天的数据来自诸多层面,人们无法拥有充分的权利来修正关于自己的数据。此外,即便是准确的数据也可能对你不利。

数据的产生、沟通、处理过程中会发生巨大的定量变化和定性变化,仅有知情权与修正数据权显然是不够的。迄今为止,试图修改这些指导原则的努力几乎全都集中于个人掌控权与隐私权这两个方面。不幸的是,其理念与实践从技术上看已经落后达一个世纪之久。而且,控制与隐私权的标准迫使人们与数据公司签下不平等合约。如果你希望用数据改善你的决策过程,你就必须同意按照数据采集者的条款收集自己的数据。一旦你这样做,就说明数据公司已经按照法律规定为你赋予了个人数据的“控制权”,而无须考虑你是否真正拥有选择权或你的个人隐私权是否会受到影响。如果你希望保护个人隐私,就不应该同意数据公司收集你的数据,但这会牺牲你对相关数据产品与服务的使用权,降低你从自己的数据中所能获得的价值。只有这样,你才能对你的数据保持掌控权。

如今,我们需要做的是制定一套标准,帮助我们评估因分享和收集数据所产生的风险与回报,同时拥有对数据公司进行问责的权利。基于20年来与数据公司的合作经验,我认为透明性与主动性原则最有可能保护我们免遭社交数据滥用的伤害,并能提高我们从中得到的价值。

透明性涵盖了个人对自己数据的知情权:内容是什么?用途是什么?对用户的好处是什么?数据公司是躲在单向镜的另一面暗中窥探你的隐私,还是也给你打开一扇窗户,让你看到它们如何使用你的数据,从而判断该公司的利益是否(以及何时)与你的自身利益一致?你需要分享多少数据,方能获得你想要的数据产品或数据服务呢?从历史上看,机构与个人之间存在巨大的信息不对称的情况,这使机构占据巨大的优势。机构不仅有强大的能力收集个人数据,还能将你的数据与他人的数据做比较。你需要了解你提供的数据与你得到的数据产品与服务是否对等。

相对于客户与零售商之间的传统关系,亚马逊是如何让购物体验具备透明性的呢?当你打算购买一件商品时,零售商会提醒你之前购买过这件商品吗?这样做会让他损失一单生意。在亚马逊网站上,如果你点击购买已在这家网站上买过的书籍,就会看到网站的提示:“你确定要买这本书吗?你在2013年12月17日买过这本书。”如果你买过某张音乐专辑中的一首歌曲,之后决定购买该专辑的其他所有歌曲时,亚马逊在“完成购买”环节会自动从这张专辑的价格中减去你之前所购歌曲的金额。亚马逊对人们的购买数据采取这种使用方式,是为了最大限度地减少客户的不满。与此相似,大多数航空公司的常飞旅客计划都会给客户发送信息,提醒其即将过期的里程数,而不是放任其作废。

不幸的是,透明性远未成为通行的标准。以给客户服务中心打电话这种典型的体验为例,拨通电话后,你肯定会听到一番警告:“为保证服务质量,本次通话可能会被录音。”你别无选择,如果你想与客服代表通话,就必须接受这样的条款。就算要录音,为什么只有公司有权获得此次通话的录音呢?如果只有通话的一方拥有获取此次通话录音的权利,那么“为保证服务质量”又意味着什么呢?数据对等原则意味着付款的客户同样可以获得录音。

无论何时,只要我听到客户服务代表说通话可能会被录音时,我就会对他说,我也可能会对此次通话录音,以保证我所获得的服务质量。在大多数情况下,客服代表都会选择与我合作,但偶尔也会直接挂断电话。当然,我也会在不征求客服代表同意的情况下自行对通话进行录音,但我要说明一点,这种做法在某些地方是违法的。如果我没有获得客服代表对我承诺的服务时,我就会利用手头的证据向他的主管投诉。如果这样做仍然无效,我就会将音频文件上传到网上,希望通过音频文件的传播催促该公司迅速解决我的问题。就像康卡斯特公司曾经遇到的情况一样,当时客户想取消服务,但是反复遭到该公司的拒绝,最终客户将通话录音发布在推特上才如愿以偿。

通过这种方式,你不必违反法律就可以摆脱不平等的对待。为了让透明性成为新的默认原则,数据公司需要向公众提供更多的信息而不是更少的信息。

但仅有透明性是不够的,你还需要主动性,主动性包含个人根据自己的数据采取行动的权利。数据公司的“默认”设置一目了然吗?你能够出于种种原因修改你的数据吗?你能随心所欲地使用公司产生的数据吗?你是被诱导(或被迫)从有限的几个选项中做出选择(这些选项几乎都更有利于数据公司)吗?你能修改参数并探索不同的情景,以发现种种可能性吗?主动性是个人根据数据公司所发现的关于他的偏好与行为模式进行选择的权利,包括要求数据公司按照他提出的条件向他提供信息的权利。

在基本层面上,主动性关乎人们有能力创造出有利于自己的数据。亚马逊公司一直坚持原原本本地在网页上呈现客户的评论,无论评论是好是坏,是五星还是一星,是为了获得他人的认同还是为了实现成为图书评论家这一人生理想,都没有关系。亚马逊更看重的是,这些评论与其他想购买图书的客户之间的关系。比如,通过评论发现,虽然客户没有选择退货,但对此次购买的商品不太满意。这些数据有助于客户判断某件推荐商品是不是自己的最佳选择,由此亚马逊公司给了客户更大的主动性。

许多营销人士津津乐道于市场定位、市场细分与转化。我不了解你们的想法,但我不想被定位、细分、转化,也不想被剖析,这些不是主动性的表达方式。我们不能想当然地认为每个公司都会主动遵循透明性与主动性原则。我们还必须超越这些原则:我们需要拥有明确的权利,这有助于我们表达自己的愿望,将透明性与主动性转化为实实在在的工具。

如果我们能促使数据公司同意提供一系列有意义的权利与工具,就能产生我所说的“关系反转”,即对个人与机构之间的传统关系予以逆转。亚马逊公司决定由客户撰写大部分商品评论,这也属于关系反转,社交数据革命将会提供更多这样的机会。随着人们拥有越来越多的工具去帮助自己做出更好的决定,过去公司常用的市场营销手段的效果将会越来越差。由公司告诉处于弱势地位的客户应该购买何种商品,这个时代已经一去不复返了。而且很快,就会由你来告诉公司应该为你做些什么。在某些地方,人们已经体会到这种变化了。

关系反转是物理学家观察世界的重要方式。关系反转经常与相变联系在一起,后者指的是外部条件导致物质属性发生突变——当加热到沸腾状态时,水就会从液态变为气态。日益增加的数据量对社会所产生的影响就相当于物理系统中热量的增加。在某些条件下——当数据公司遵循透明性与主动性原则时,就会产生关系反转,也就是说,这更有利于个人而非公司或公司的首席市场官。

我们所有人的利益都与此次社交数据革命息息相关。如果你希望从社交数据中获益,就必须分享自己的信息。你从社交数据中获得的价值通常在于你拥有了更强的决策能力,即在促成交易的谈判中、购买产品与服务时、申请贷款的过程中、寻找工作时、获取教育与医疗时、改善你所在社区的硬件时,你可以做出更明智的决定。你在分享数据时所付出的代价与承担的风险不应大于你所获得的收益。数据公司收集的数据及其采取的行动应具有透明性,这一点至关重要。另外,你还需要对数据产品与服务拥有一定的掌控力。否则,人们如何判断自己所获得的收益是否大于付出的代价呢?

新的游戏规则

信息是权力的中心。如果你拥有的信息比别人多,那么你很可能从中获利,这就像二手车销售员将劣质车推销给不明真相的客户一样。随着沟通与处理过程变得越来越便宜和普及,巨大的信息不对称风险发生的可能性将越来越大,因为没有人能够掌握所有数据。

在这些产生和分享的数据中,有许多是关于我们的个人生活的:居住的地点、工作的地点、前往的地点,喜欢的人、不喜欢的人、陪伴的人、共进午餐的人,运动量、服用的药物、家用电器、触动心灵的杂志。我们的生活在数据公司面前是透明的,这些公司收集并分析我们的数据,有时它们还会私自销售我们的数据,或者擅自保存我们的数据。在个人数据被修改、交换、销售的过程中,我们需要拥有一定的发言权,此外我们还要对个人数据的使用制定更多的条款。双方(数据创建者与数据公司)都必须遵循透明性与主动性原则。

这需要我们从根本性上改变对数据和自我的看法。在第1章中,我会介绍数据公司分析数据的几种方式,并以提炼过程做类比,说明公司如何将原始数据转化为产品与服务。我将在第2章中讨论个人及其特点,并论述我们在生活中留下的电子踪迹是如何破坏我们的隐私性幻觉的(搜索、点击、评论、使用与刷卡),并在此过程中产生了新的身份概念。无论我们是否愿意,都发出了自己兴趣的真实信号。在第3章中,我将论述重点从个人转移到人与人之间的关系,以及社交网络怎样展示并影响数字化时代的信任。在第4章中,随着各种传感器(不只是摄像头)的联网,我将介绍人们如何利用精确度越来越高的手段记录我们所在的环境,以及数据公司如何分析这些传感器收集的数据,并推断出人们的位置、情绪状态与兴趣。

在此基础上,我提出了6项权利。为了确保未来我们的数据能够真正为我们服务,我认为这些权利十分关键。其中有两项权利是访问数据的权利与核实数据的权利,它们旨在提高透明性。其余4项权利主要通过主动性原则使人们对自身数据具有更强的掌控力,包括修正数据的权利、对数据进行模糊处理的权利、利用数据开展实验的权利、将数据导出给其他公司的权利。通过对个人数据行使上述权利,就能对我们的购物方式、支付与投资方式、工作方式、生活方式、学习方式、使用公共资源的方式等产生影响。在最后一章中,我将论述如何实现这6项权利。

在这个时代的转折点上,人们正在界定创建数据的人与把数据转化成产品和服务的组织之间的关系。不仅游戏规则正在改变,从性质上看,我们正在玩的这个新游戏还要求我们重新界定客户与零售商、投资者与银行、雇主与雇员、患者与医生、学生与老师、公民与政府之间的关系。此时,我们应当表明立场并真正了解数据的用途,以便能够获得利益并清楚由此产生的结果。只有这样,我们才能评估我们的利益是否与数据公司的利益一致。对于大多数新科技而言,并非机器决定一切。只要人们使用机器,调整自己的期望,并在此过程中修订社会规范,社交数据革命就会悄然而至。

如果我们迎接这场挑战,数据就有可能由取之于民、归之于民演变为用之于民。让我们一起投身于这场革命吧!

后记

在伯罗奔尼撒战争中,苏格拉底有时会与自己的弟子、柏拉图的哥哥格劳孔坐而论道,并向他展示知识的来源。苏格拉底认为,通过让光照进现实世界,真理就能显现出来。在“洞穴之喻”中,一群人被迫一生都居住在某个黑暗的洞穴中。他们的脖子被锁链绑住,无法转头。在他们面前有一面墙壁,在他们后面生起一堆篝火,有人拿着各种假人假物,在火堆前前后走动。火光非常强烈,足以使这些从小就被囚禁在洞穴内的人看到映照在眼前洞壁上的人影活动——前后移动、相互交流、交换物品。有时,这些影子从一个地方突然跳跃到另一个地方,有时它们的动作具有连贯性,并且井然有序。洞穴中的人们日复一日地观看这些人影,并将外界的声音与这些人影联系在一起。他们对世界的认识仅限于他们看到的这一切。

之后,苏格拉底假设洞穴中有个人有机会转动自己的头。由于长期身处黑暗,他的眼睛已经适应了黑暗,能看到极其昏暗的影子。当他朝篝火看去时,强烈的光线令他暂时失明。他努力想看清,但却很困惑、很沮丧,于是他又转回头面向洞穴中的黑暗,此时他又能看见了。他甚至可能会告诉其他人,除了洞壁上的影子他看不到任何东西。

之后,这个人获得了自由。火光再次令他暂时失明,但这次他有充分的时间适应它。最终,他自由了!不久后,他发现其实是假人在前后移动,并投影在洞壁上——他认识到假人与这些影子的关系。

最后,这个人离开了洞穴,沐浴在阳光下。此时,他明白自己需要时间适应光线,他很有耐心。他看到了影子,但他认识到这些影子并非现实。

如果他返回洞穴,努力劝说其他人走出洞穴、沐浴阳光,他可能会遭到拒绝。回到黑暗的洞穴之后,他会再次暂时失明,无法看清假人的影子。由于他再也无法看到任何东西,洞穴中的其他人可能认为这个人的眼睛已经被光线毁掉了。谁会责备这些人呢?毕竟没有人愿意自己的世界被颠覆。

柏拉图在2000多年前讲述了苏格拉底的这次对话。如今,我们面临的情况与之极为相似。脸谱网与谷歌等数据服务商推出的项目就像在洞壁上投射的影子,它可以让我们解读。与“洞穴之喻”中的影子一样,我们生活中留下的电子踪迹也是真实世界的产物:谷歌不会编造网页作为我们的搜索结果,脸谱网也不会凭空捏造好友的发帖以骗取脸谱网新闻馈送的用户。同时,我们通过数据服务商带来光明,它们帮助我们理解海量数据的创建方式。如此大规模的交互与活动不仅令柏拉图无法想象,我们也会深感震惊。

但是,黑暗中发生的事情很多。如果算法投影在洞壁上的所有内容都无法转化为客观现实,我们就会遇到风险。我们需要时间来适应这些新型的数据来源,并了解如何利用工具帮助我们观看和使用这些数据来源,甚至享受它们。透明性相关的权利将使我们看到光线的形态并了解影子的形成过程,且不会出现暂时失明;主动性相关的权利将使我们能根据自己的需要,改变并移动光源。

黑暗的洞穴生活已经一去不复返了。与柏拉图的囚徒不同,我们的头并未被锁链束缚。即便付出大量的工作,我们也必须自由地观看,自由地行动。

即便一开始光线极为耀眼,我们也必须这样做。

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/31 13:53:51