![]()
内容推荐 本书从数据可视化系统的体系架构出发,以分布式并行数据库为基础,对空间数据的可视化问题进行了深入研究,提出了对连续型和离散型两类数据的不同处理模型,从对不同数据查询的差异性出发,提出了并行数据库多副本异构方式的分区方案,能够大幅提高系统性能。本书能够为从事大规模数据处理和数据库方向研究生及其他大数据相关从业人员提供参考。 目录 第1章 绪论 1.1 背景和意义 1.1.1 空间数据 1.1.2 交互式数据可视化 1.1.3 意义 1.2 挑战及思路 1.2.1 挑战 1.2.2 思路 1.3 本书结构 第2章 数据可视化方法相关研究 2.1 以数据库为中心的方法 2.1.1 基于近似查询处理的方法 2.1.2 基于大数据管理系统的方法 2.1.3 基于数据立方的方法 2.2 以前端显示为中心的方法 2.2.1 基于预加载技术的方法 2.2.2 基于逐步更新技术的方法 2.3 商业数据可视化系统 2.4 小结 第3章 可视化图像的相似度研究 3.1 近似图像生成方式和相似度函数属性 3.2 图像相似度测量 3.2.1 基于RGB的图像相似度测量函数 3.2.2 基于数据的图像相似度测量函数 3.2.3 代表性函数 3.3 图像相似度阈值 3.4 小结 第4章 连续型数据处理模型 4.1 MVS:预生成图像 4.1.1 MVS数据结构 4.1.2 使用EV重写SQL 4.2 MVS+:增加低分辨率图像 4.2.1 精简图像 4.2.2 利用精简图像计算图像的近似度 4.2.3 利用子区间提高近似图像相似度 4.2.4 查询重写 4.2.5 一般查询 4.2.6 MVS+的优势分析 4.3 图像建立、存储及维护 4.3.1 图像建立 4.3.2 图像存储 4.3.3 图像维护 4.4 扩展 4.4.1 多维属性 4.4.2 其他图像类型 4.4.3 缩放和拖拽 4.5 实验 4.5.1 实验数据和平台 4.5.2 用户调研 4.5.3 图像的创建时间和空间大小 4.5.4 Marviq性能 4.5.5 图像分裂和合并 4.5.6 与VAS的比较 4.5.7 与Sample+Seek的比较 4.5.8 其他近似度函数 4.6 小结 第5章 离散型数据处理模型 5.1 TABLESAMPLE和LIMIT概述 5.1.1 TABLESAMPLE 5.1.2 LIMIT 5.1.3 TABLESAMPLE与LIMIT对比 5.2 模型建立 5.2.1 以TABLESAMPLE为基础的rQ-模型 5.2.2 以LIMIT为基础的kQ-模型 5.3 kQ-模型优化 5.3.1 丢弃低频关键字 5.3.2 减少LIMIT查询数量 5.3.3 增量方式绘制可视化图像 5.3.4 使用样本kQ-曲线及聚类 5.3.5 优化算法 5.4 离线样本 5.4.1 利用两个数据表生成可视化图像 5.4.2 随机样本 5.4.3 数据密度敏感的分层抽样 5.5 模型扩展与维护 5.5.1 复杂条件查询 5.5.2 模型存储与维护 5.6 实验 5.6.1 实验数据和平台 5.6.2 图像近似度与k值 5.6.3 聚类数量对k值的影响 5.6.4 离线样本创建时间 5.6.5 离线样本对查询的影响 5.6.6 扩展性 5.6.7 分类数据 5.7 小结 第6章 数据分区优化 6.1 数据分区概况 6.2 相关工作 6.2.1 多分区方案设计 6.2.2 分区方案搜索 6.2.3 数据分区中间件 6.3 研究思路及方案概况 6.3.1 研究思路 6.3.2 方案概况 6.4 距离模型 6.4.1 定义及术语表示 6.4.2 距离函数 6.4.3 距离矩阵 6.5 多方案分区生成算法 6.5.1 工作负载聚类 6.5.2 分区方案生成 6.6 查询路由算法 6.6.1 已知查询 6.6.2 ad-hoc查询 6.6.3 更新查询 6.7 实验验证 6.7.1 实验数据和平台 6.7.2 工作负载聚类 6.7.3 分区方案性能比较 6.8 小结 第7章 总结与展望 7.1 总结 7.2 展望 7.2.1 复杂查询 7.2.2 底层数据库 参考文献 |