内容推荐 在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。张引著的《半结构化数据管理关键算法研究与实证》以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。 作者简介 张引(1986一),男,江西九江人,理学博士,现为中南财经政法大学计算机科学与技术系副教授、硕士生导师,长期从事认知计算与智能服务领域的研究,目前主持国家自然科学基金项目2项、教育部人文社会科学研究项目1项;近5年共发表论文80余篇,其中SCI收录超过50篇,并有9篇论文入选ESI高被引论文。在《IEEE Network》《IEEE Access》等国际知名SCI期刊担任编委等职务,曾在《Future Generation Computer Systems》《IEEE IoT Journal》《Electronic Markets》等知名SCI/SSCI期刊担任客座编辑等职务;曾在多个国际学术会议担任大会主席等职务。2014年当选IEEE计算机协会大数据技术委员会副主席,2015年当选IEEE高级会员,2016年入选中南财经政法大学“文澜学者”计划,2017年入选湖北省“楚天学者计划”,2018年获得《IEEE Systems Jourhal》年度最佳论文奖。 目录 第一章 半结构化数据的应用背景 第一节 研究背景 第二节 研究内容及意义 一 研究内容 二 研究意义 第三节 本书结构 第二章 半结构化数据的基础知识 第一节 半结构化数据的结构特征 第二节 半结构化数据的结构模型 第三节 半结构化数据的模式语言 第四节 半结构化数据的查询语言 第五节 半结构化数据的应用程序接口 第三章 半结构化数据的管理模型 第一节 半结构化数据模式提取的相关研究 第二节 半结构化数据节点编码的相关研究 第三节 半结构化数据索引的相关研究 第四节 半结构化数据查询处理的相关研究 第四章 半结构化数据的模式提取 第一节 半结构化数据的元素内容模型 一 半结构化数据的树状结构模型 二 半结构化数据的元素内容模型 三 提取大规模半结构化数据模式的质量标准 第二节 基于正则表达式的模式提取方法 一 元素内容模型的正则表示 二 XStruct算法简介 三 XStruct算法的优缺点 第三节 基于集合/序列的模式提取方法——XTree 一 XTree算法的组成 二 基于集合/序列的元素内容模型 三 XTree的数据结构 四 提取元素内容模型 五 识别数据类型 六 提取属性 七 输出模式 第四节 实证研究 一 XTree的算法的时间和空间复杂度分析 二 元素内容模型的有序性判断对模式准确性的影响 三 实验环境及测试工具 四 测试数据集 五 提取不同文档的模式的时间和内存消耗以及准确性 六 XTree算法提取同结构的不同大小的数据模式的时间消耗 第五节 小结 第五章 半结构化数据的节点编码 第一节 半结构化数据节点编码的特点 一 半结构化数据节点编码的质量评价标准 二 基于区间的节点编码方案 三 基于前缀的节点编码方案 四 ORDPATH编码方案 第二节 D2编码方案 一 D2编码方案的基本概念 二 静态D2编码 三 动态D2编码 第三节 D2编码的二进制表示 一 D2编码的二进制表示 二 D2物理编码的比较 第四节 实证研究 一 D2物理编码长度分析 二 D2物理编码长度实验 第五节 小结 第六章 半结构化数据的索引和查询处理 第一节 D2-Index索引策略 一 主索引 二 辅助索引 三 索引的动态更新 第二节 基于D2-Index索引策略的查询处理 一 查询语言 二 查询器 第三节 实证研究 第四节 小结 第七章 半结构化数据与大数据 第一节 大数据时代来临 第二节 大数据基础 一 大数据的定义 二 传统数据分析方法 三 大数据分析方法 四 大数据分析模式 五 大数据分析工具 第三节 大数据应用 一 应用演化 二 大数据分析的关键领域 三 大数据的典型应用 四 大数据的研究现状及发展趋势 第八章 总结 第一节 主要内容 第二节 未来研究展望 一 大规模半结构化数据模式的更新 二 大规模半结构化数据的信息检索 三 分布式半结构化数据的管理 参考文献
|