![]()
编辑推荐 "从业务视角出发,总结了不同阶段的代表性工具(Excel、SQL、Tableau)背后的共同点和差异,总结了“样本范围、问题描述和问题答案”的分析方法,并借助“层次”的概念与高级计算、结构化分析前后关联,为业务用户走向高级分析指明了一条鲜明的道路。 在层次分析的基础上,把可视化分析分为结果分析、特征分析和结构化分析3 个阶段,借助Tableau 字段维度和问题层次的概念,精彩地阐述了“大数据分析是多维度、结构化分析”的观点。 《业务可视化分析: 从问题到图形的Tableau方法》从问题出发阐述图形,而非为了图形讲解图形,其中讲解了很多具有启发性的案例,比如从绝对坐标轴到相对坐标轴的转化、文本表的修饰等。" 内容推荐 对广大的业务分析师而言,业务分析(或者称为商业分析)应该从业务和问题出发,可视化是实现的方法,辅助决策是最终的目的。本书以业务分析为起点,介绍了“样本范围、问题描述和问题答案”的解析方法,以及聚合过程、连续与离散的字段分类,共同作为业务分析、可视化分析的理论基础。本书借助敏捷BI工具Tableau,详细介绍了7种基本问题类型(排序、时序、占比、文本、分布、相关性、地理)及其对应的基本图形,并介绍了基于标记、坐标轴、参考线、计算的增强分析方法。本书的目的是让读者从“三图一表”的结果分析,经由分布和相关性的特征分析,走向业务分析中的关键领域――多个问题的结构化分析。 目录 第1篇从业务和问题出发的可视化体系 第1章我的故事:业务分析需要可视化2 1.1生活/工作面前,我们都一样.2 1.2带着问题启程6 第2章奠基:业务可视化分析的价值.7 2.1古往今来,分析的终极目的是辅助决策7 2.2决策:获得信息、做出判断10 2.3简单可视化:帮助领导更快地获得信息11 2.4交互可视化:可视化是假设验证的工具14 2.5高级可视化:分布、相关性分析与结构化分析16 2.6Tableau:敏捷BI助力决策分析18 第3章地平线:问题分析的方法与数据基础.20 3.1问题的结构化分析与“第一字段分类”21 3.2分析的动态过程:聚合是本质23 3.2.1Excel数据透视表:拖曳即聚合23 3.2.2SQL的聚合查询:窗口式查询24 3.2.3TableauVizQL可视化聚合查询.26 3.3行级别明细数据是聚合的起点,是分析的原料27 3.3.1数据表中包含的数据常识:数据类型与分类.27 3.3.2理解数据表行级别的业务逻辑及其专享性.34 3.3.3聚合度是以数据表行级别为基准点的、衡量问题层次高低的尺度.37 3.4直接聚合:基于行级别的直接聚合类型40 3.4.1描述规模:总和、平均值、计数.40 3.4.2描述数据的波动程度:方差和标准差.41 3.4.3关注个体、走向分布:百分位函数及优选值、最小值、中位数.44 3.5从数据到问题的关键:“第三字段分类”47 3.5.1第三字段分类:行级别计算与聚合计算.47 3.5.2理解聚合计算中的典型代表:“比值聚合”.49 3.6间接聚合:基于视图聚合的二次聚合50 3.6.1“复杂问题”的两个方向特征.50 3.6.2基于直接聚合的二次聚合:大数据的OLAP分析51 3.7从问题分析视角看数据分析的发展阶段57 3.7.1小数据时代的多角度明细展示.57 3.7.2数据统计时代的聚合汇总57 3.7.3大数据时代的结构化分析58 第4章启程:可视化构建方法与扩展路径60 4.1从聚合到图形:第二字段分类与图形构成要素60 4.1.1可视化坐标空间:坐标系与坐标轴.62 4.1.2“第二字段分类”与坐标轴.63 4.1.3可视化视觉模式与图形类型.70 4.1.4可视化的意义描述74 4.27种主要的问题类型及其主要图形.75 4.2.1传统三大图及其局限性76 4.2.2文本表:侧重度量指标的高密度展现.78 4.2.3分布分析的三大典型图形78 4.2.4相关性:散点图与双轴折线图.82 4.2.5地理位置可视化83 4.3从基本问题类型到复杂图形的延伸方法综述85 4.3.1从问题分析到图形增强分析的完整路径.85 4.3.2基于行列的空间扩展:分区与矩阵.86 4.3.3基于标记的增强分析:分层绘制方法.89 4.3.4基于坐标轴的扩展:双轴、同步与多轴的合并处理.96 4.3.5基于参考线的扩展:增加视图聚合的二次聚合.97 第2篇问题的7种基本类型与可视化方法 第5章从问题到图形的可视化逻辑.102 5.1从问题到图形的启蒙与进化102 5.1.1《用图表说话》中的三步走方法.102 5.1.2“问题的字段解析方法”与基本问题类型.103 5.2可视化图形分类方法与可视化过程105 5.2.1FT可视化词典.105 5.2.2DataPoints中的数据可视化过程107 5.2.3Abela的“图形推荐”逻辑108 5.2.4面向IT的Echarts分类与Tableau.109 第6章排序与对比(部分与部分).111 6.1基本条形图与多个离散维度条形图111 6.1.1并排条形图(side-by-sidebar):离散字段并排构成分区.112 6.1.2条形图矩阵:离散字段交叉构成矩阵.113 6.1.3矩阵实例:日历矩阵条形图.114 6.1.4堆叠条形图:你喜欢喝什么咖啡.116 6.1.5比例条形图:把堆叠条形图转化为占比分析.118 6.2包含多个度量坐标轴的条形图119 6.2.1字段重要性递减的多种布局方式.119 6.2.2考虑字段关系的双轴布局方式.120 6.2.3并排条形图:多个绝对值度量字段的对比.122 6.2.4重叠条形图:多个绝对值度量字段的包含关系.124 6.3字段类型和属性对可视化的影响125 6.3.1字段类型和属性对颜色的影响.125 6.3.2“绝对值”与比值:字段属性对标记选择的影响.127 6.4坐标轴的调整与组合128 6.4.1默认零点:除非必要,谨慎更改.129 6.4.2坐标轴“倒序”:有些数据越大越差.129 6.4.3绝对值刻度与百分位刻度130 6.4.4从“等距坐标轴”到“不等距坐标轴”.131 6.4.5棒棒糖图:虚拟双轴132 6.5以条形图为底色的进阶与高级图形133 6.5.1靶心图:在排序基础上增加对比关系.133 6.5.2“进度条”:展示单一对比关系的条形图变种.135 6.5.3结构化分析实例:条形图的“高级化”.138 第7章时间序列与序列相关性140 7.1时间序列的构成140 7.2折线图的多种延伸形式141 7.2.1时间的层次与连续/离散属性.141 7.2.2并排折线图和矩阵折线图143 7.2.4多维度折线图、堆叠面积图、百分比堆叠面积图.144 7.2.3包含时序的柱状图与结构化分析.147 7.3包含多个度量的时间序列149 7.3.1时间序列中的双轴与柱状图.149 7.3.2双轴的改变:柱状图与折线图的结合.150 7.3.3基于公共基准的多轴合并151 7.4时间序列与条形图的结合:甘特图及其变种152 7.4.1标准甘特图:沿着连续日期延伸.152 7.4.2股票蜡烛图:两个甘特图的重叠.154 7.4.3跨度图:“伪装的甘特图样式”.155 7.4.4阶梯图:以阶梯方式表达“跨度”.157 7.5日期的高级转化:绝对日期与相对日期159 7.5.1原理:何为绝对和相对时间轴.159 7.5.2“公共基准”案例:产品在不同时间段的业绩对比.160 7.5.3“公共基准”案例:客户复购分析.163 7.6时序分析中度量的处理与高级图形166 7.6.1聚合度量的累计汇总处理166 7.6.2绝对值与同比双轴图:同比或环比的比率.167 7.6.3排序图:绝对值转化为相对排序.168 7.6.4高级案例:地平线图――借助高级计算处理度量.170 7.7坡面图:次序字段的前后变化174 7.8在趋势中增加对比关系:双折线增加阴影区175 第8章占比(部分与总体占比).179 8.1占比问题类型与饼图179 8.2树状图:占比与层次关系181 8.3初级:饼图作为辅助图形查看结构184 8.4中级:结合计算自定义分组及其占比186 8.4.1行级别分组:使用组和行级别计算自定义分组.186 8.4.2特定层次的分组:使用集和高级计算动态分组.187 8.5中级:使用多种方法展示类别的占比189 8.5.1方法一:使用“隐藏”功能分析单一类别占比.189 8.5.2方法二:使用“行级别计算”分析单一类别占比.190 8.5.3方法三:使用“筛选和高级计算”分析单一类别占比.191 8.6高级图形:环形图、旭日图、南丁格尔玫瑰图192 8.6.1环形图:最简单的双层次结构.192 8.6.2旭日图:双层占比193 8.6.3南丁格尔玫瑰图及个人建议.194 第9章文本表及其延伸形式196 9.1文本表的关键场景:优选聚合与“总分结构”196 9.2交叉表的优势与推荐场景198 9.3让交叉表更实用:增加可视化修饰的方法200 9.3.1典型交叉表的样式与说明200 9.3.2简易法:基于度量名称的颜色修饰.201 9.3.3简易法:基于单一度量的突出显示表.203 9.3.4高级法:基于坐标轴和标记的“文本自定义”.204 9.3.5高级法:使用自定义字段逻辑控制形状或其他.208 9.4让简单丰富起来:善用工具提示与仪表板互动209 9.5文字云与气泡图:不常使用和不推荐的图形211 9.6总结:用好“三图一表”,展开业务面纱212 第10章大数据的关键:超越个体、走向分布.214 10.1从个体分析到分布分析214 10.2直方图:分布分析第一图215 10.2.1简单直方图:使用数据桶(bin)在数据表行级别创建直方图216 10.2.2高级直方图:使用高级聚合计算和数据桶生成直方图区间.217 10.2.3基于RFM模型的客户分布分析219 10.3箱线图:离散分布与异常发现221 10.4帕累托图:特殊的头部集中分布222 10.4.1横轴百分位处理:将离散维度序列转化为连续百分位坐标轴.224 10.4.2纵轴累计百分比处理:连续度量的百分位转化.224 10.4.3空间分类处理:帕累托图的颜色分类和互动筛选.225 10.5自定义分布分析:参考线与参考分布模型227 10.5.1使用多条“百分比”参考线构建区间.228 10.5.2自定义百分位分布区间229 10.5.3分位数分布区间230 10.5.4标准差分布与“质量控制图”和“六西格玛区间”.230 第11章超越经验,走向探索:广义相关性分析.234 11.1散点图与参考分区:波士顿矩阵234 11.2中级:散点图矩阵和“散点图松散化”237 11.3高级:用皮尔逊系数生成相关值矩阵241 11.4层次关系:多个维度字段之间的结构关系.244 11.5次序字段的流向分析:漏斗图和桑基图247 11.5.1漏斗图(上):基于次序字段的变化.247 11.5.2漏斗图(下):基于度量值的变化.250 11.5.3桑基图:多阶段的流向变化(简要).252 11.6瀑布图:多个数值的依赖关系253 11.7雷达图:多角度的综合关系256 11.8相关性或因果关系:基于空间的流行病学案例.259 第12章特殊的分布:地理空间分析.264 12.1地理空间和地理图层264 12.2点图与热力图:地理空间分布265 12.3符号地图与填充地图267 12.4自定义地理空间与空间矩阵270 12.4.1为数据点增加缓冲区270 12.4.2自定义地理空间:“化学元素周期表”.271 12.4.3高级案例:使用表计算自定义空间矩阵.272 12.5路径地图:两种数据结构,两种绘制方式274 12.6地理空间图形的说明275 第3篇超越:从可视化分析走向结构化洞察 第13章样本控制与假设验证:交互.279 13.1在Excel、SQL、Tableau中构建分析样本.279 13.1.1Excel与SQL中的静态筛选.279 13.1.2在Tableau中创建筛选的基本方法281 13.2样本控制的形式与归类282 13.2.1快速筛选器的常见形式与优先级.282 13.2.2关联筛选器和共用筛选器285 13.3基于中间变量的高级样本控制286 13.4样本控制的高级形式:指定层次的条件筛选289 13.4.1指定层次条件筛选的3种方式.289 13.4.2购物篮关联分析的样本解读――量化筛选条件.290 13.5性能:逻辑计算位置对筛选的影响293 13.5.1筛选的本质与筛选的标准位置.293 13.5.2在聚合过程中间接筛选的“非标准操作”及其代价.295 13.5.3不同筛选方法的高级分类与适用场景.296 第14章从表象到本质:结构化分析是业务可视化分析的灵魂.299 14.1结构化分析是通往业务探索的必由之路299 14.1.1结构化分析是业务复杂性的要求.300 14.1.2结构化分析的基本形式301 14.2可视化分析中常见的层次及其组合关系303 14.2.1行级别层次、问题层次及聚合度.303 14.2.2结构化分析的基本类型305 14.3结构化分析的几种典型场景和案例305 14.3.1交易的利润结构分析:主视图引入行级别层次的聚合.305 14.3.2客户的利润结构分析:主视图引入更低层次的聚合.307 14.3.3客户矩阵分析:当前视图层次引入独立层次的聚合.309 14.3.4环形图:当前视图层次引入更高聚合度层次的聚合.310 14.4结构化分析的高级形式:嵌套LOD的多遍聚合313 14.4.1客户购买力:使用嵌套LOD完成多遍聚合.313 14.5通用的层次分析方法316 14.5.1结构化分析与“问题结构”.316 14.5.2层次分析的4个步骤317 14.6和结构化分析相反的“努力”方法318 14.6.1“形式大于内容”的图形318 14.6.2缺乏代表性和意义的指标321 14.6.3缺乏互动性的图表321 14.6.4不符合直觉的设计322 第15章归来:成为优秀的业务分析师的个人建议.323 15.1好奇、探索和持续学习的欲望,是前进的源泉323 15.2学习理解原理,方能举一反三、事半功倍324 15.3深入理解业务,方能立于不败之地325 15.4分析要从明细开始,过度整理会远离真相326 15.6循序渐进,不要好高骛远328 后记&参考资料.330 书评(媒体评论) "国际数据管理协会(DAMA)是一个全球性的专业组织,由数据管理和数字化相关的专业人士组成;协会自1980年成立以来,一直致力于数据管理和数字化的研究、实践及相关知识体系的建设,先后出版了《DAMA数据管理字典》和《DAMA数据管理知识体系指南》等。商业智能是数据管理的核心内容之一,它连接技术与业务、数据与决策、IT部门与业务部门,以辅助业务决策为最终目的。本书详细介绍了业务分析的方法,特别是问题分析的结构模型,并借助Tableau敏捷工具以图形的方式实现,对广大的数据和业务用户而言,具有很高的参考价值。 ——汪广盛教授,国际数据管理协会中国区主席
数据可视化分析的根本目的是服务业务,而不仅仅为制作好看的图表,“业务、数据、可视化表达”三者应该融为一体,因此深刻理解图表的原理及其适用的业务场景是数据分析师的必修课。相反,只注重图表形式,却忽视业务洞察,则是数据分析师的大忌。本书中喜乐君用大量的实例,系统介绍了从问题到图形的Tableau方法,而通过可视化手段洞察业务也正是Tableau的精髓所在,这本书能够帮助“表哥/表姐”进阶成为真正的数据分析师! 目前市场上介绍Tableau软件操作的书籍比较多,而真正介绍可视化原理及业务分析的作品甚为难得,本书内容翔实丰富,融入了喜乐君大量的实践和思考,堪称是一部匠心之作! ——高云龙,Tableau顾问,《大话数据分析》作者
在我看过的国内外各类关于Tableau的书籍中,喜乐君的这本书独树一帜。喜乐君能够站在技术小白的角度,将其对Tableau可视化分析的理解,特别是底层逻辑的理解,和盘托出。它看起来是一本技术书,实际上是一本教会读者如何理解数据,理解Tableau,最终和数据做朋友的故事书。若读者能够像喜乐君一样有耐心,一定会茅塞顿开,打开数据新世界。 ——张星辰,荣联科技集团数据服务业务总监
不论是统计分析、商业分析,还是当前流行的机器学习和深度学习等数据挖掘的分析技术,都离不开数据的可视化;在喜乐君的帮助下,中原消金顺利推广了业务分析中的Tableau方法。本书深入阐述业务分析和可视化分析的思路、方法与实践案例,虽然以Tableau作为示例,但其中的分析思路和可视化的方法却不限于Tableau,尤其有助于IT用户扩展分析思路,从而更好地赋能业务部门。 ——李杨,中原消金大数据平台与应用架构师
喜乐君对大中华地区业务用户的影响是靠前的,本书是他成为Tableau Zen Master后的全新力作。此作不仅体现了Tableau面向业务分析的价值精髓,而且为非IT用户指明了一条循序渐进、未来可期的成长之路。相信这本书能帮助更多业务用户看到并理解数据的价值,并培养面向问题、面向业务的数据分析思维。 ——李霏菲, Tableau Customer Success Manager
作为一家跨境互联网企业,天然拥有大量的数据,同时面临如何把大量数据转化为经营决策的挑战。很多人推荐使用Tableau,起初走了很多弯路,直到遇到喜乐君,他对工具与方法的深刻理解令人钦佩。在作为咨询顾问的一年时间里,喜乐君不仅帮助我们深刻理解了敏捷业务分析工具,更提供了完整的业务思考方式,帮助企业建立了客户特征分析、迁徙分析等的模型思路。 ——黄踵青,广州市卡贝路贸易有限公司总经理
本书精彩地讲述了如何从业务问题出发,将业务洞见以可视化语言呈现,最终用以指导业务决策。喜乐君对看似简单却极为重要的概念进行深入分析,形成了富有逻辑的系统分析方法论,为各领域的业务人员连接数据资产和业务价值铺平了最后一公里——Tableau则是最后一公里敏捷、高效的工具。喜乐君根据自己多年的思考和经验将两者有机结合,内容既有深度又形象易读,精心绘制的插图反映了满满的诚意。本书可以帮助业务人员快速参与大数据分析,从而赋能企业决策。 ——李朝振博士,世界500强企业Tableau用户
一直很喜欢喜乐君的书籍和文章,他可以把业务思维和IT思维结合起来,然后用直白、易懂、流畅的语言讲授给你。本书更是从业务视角出发,把一个个图形与合适的业务场景联系起来:逻辑清晰、案例丰富、思维结构性强,配图也是精心设计,能看出作者的用心之深。 ——唐小强,百胜中国
Tableau易学、易上手,但从初级提高到中级或更高水平,殊为不易,这需要大量实际业务分析项目的实践和经验积累。Tableau网站的帮助文件和市面上大多数Tableau书籍、教程专注于软件功能介绍,而基于业务层面的书籍少之又少。喜乐君的这本磨刀之作汇集了他多年的Tableau项目和培训经验,从业务需求出发,细致透彻地讲解如何将Tableau各方面的知识点恰当地运用到实际工作中,如何用适合的图形来表达数据的特点,发现商业机会。本书秉承了喜乐君一贯的行文风格,图文并茂,逻辑清晰,实为之佳作。 Michael Ye ,美国资深商业智能分析师,Tableau Ambassador
商业环境快速变化,数字创新助力转型。在平安集团数据化经营战略指导下,平安普惠近年来持续推进数字化转型,一年来与喜乐君老师深入合作,为200多个数据分析岗赋能Tableau中、高阶分析能力,实现了全国二级机构经营报表自动化、智能化,阶段性地实现了提效率、提效益、提产能的转型初心。本书面向业务分析场景,从问题出发,运用工具和可视化分析方法,帮助业务用户发现洞见,从而更好地助力经营和管理决策。 ——陈珊珊,平安普惠财企中心数据化经营项目管理团队负责人" |