网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大数据技术前沿
分类
作者
出版社 电子工业出版社
下载
简介
编辑推荐

互联网和物联网的广泛应用,使得我们工作和生活等方方面面的数据大量积累。由此而兴起的大数据科学正在酝酿着新的重大的技术革命,阮彤、王昊奋、陈为、张华平、高凯等编著的《大数据技术前沿》以大数据的技术前沿为视角,从大数据应用技术、大数据运行支撑平台、大数据安全及大数据获取等多个维度向读者全面介绍了大数据技术。相信本书一定能够给正在从事和希望从事大数据应用实践和技术研发的读者以启迪。

内容推荐

大数据的理论和应用都处于探索阶段,阮彤、王昊奋、陈为、张华平、高凯等编著的《大数据技术前沿》选取了大数据研究与应用中的部分热点问题,将科研机构的研究成果用浅显的方式展现给读者。本书分为9章,第1章大数据可视化,描述如何用合理的数据展现方法发现数据规律;第2~4章通过自然语言处理、社交网络挖掘、语义网络与知识图谱等有关非结构化数据处理技术来阐述大数据的经典应用;第5~7重点介绍利用基于图数据库、内存计算、分布式存储系统的大数据存储与管理等大数据平台支撑;第8~9章探讨基于众包技术扩充数据来源与提高数据质量,并围绕大数据环境下的隐私保护问题,讨论了大数据安全技术。本书通过系统、多方位地总结大数据的技术前沿,使读者可以快速了解大数据在学术方面的最新成果。

目录

第1章 大数据可视化

 1.1 可视化基础

1.1.1 可视化释义

1.1.2 可视化流程

1.1.3 可视化对象

1.1.4 可视化方法

 1.2 大数据可视化介绍

1.2.1 大数据可视化特点

1.2.2 大尺度数据的可视化

1.2.3 快速变化数据的可视化

1.2.4 多变量数据的可视化

1.2.5 非结构化数据的可视化

1.2.6 大数据可视分析

 1.3 可视化与可视分析研发资源

1.3.1 代表性开源与商业软件

1.3.2 开发工具与编程语言

1.3.3 可视化信息资源

1.3.4 部分可视化科研机构

 参考文献

第2章 文本大数据处理

 2.1 文本大数据概述

 2.2 中文词法分析

 2.3 句法分析

 2.4 语义分析

 2.5 开源项目与共享工具

 2.6 文本大数据的部分应用

2.6.1 概述

2.6.2 基于双数组Trie树的面向微博短文本的分词

2.6.3 词义消歧

2.6.4 未登录词识别

2.6.5 文本分类与文本聚类

2.6.6 机器翻译

2.6.7 其他应用

 参考文献

第3章 社交网络大数据挖掘

 3.1 概述

 3.2 大规模异构网络集成

3.2.1 计算模型——COSNET

3.2.2 模型求解

3.2.3 实验结果

 3.3 基于交互的网络机器学习

3.3.1 网络数据的主动交互学习

3.3.2 算法模型——MaxCo

3.3.3 网络流数据的主动交互学习

3.3.4 算法模型

 3.4 基于随机路径的高效网络拓扑相似度算法

3.4.1 问题定义

3.4.2 基于随机路径的网络拓扑相似度算法——Panther

3.4.3 实验结果

3.4.4 小结

 3.5 个体行为与网络分布的统一建模框架——M3D

3.5.1 研究方案

3.5.2 实验验证

 3.6 总结和展望

 参考文献

第4章 语义大数据——知识图谱

 4.1 大规模知识图谱技术

4.1.1 知识图谱的表示及其在搜索中的展现形式

4.1.2 知识图谱的构建

4.1.3 知识图谱在搜索中的应用

4.1.4 总结

 4.2 行业知识图谱工具

4.2.1 简介

4.2.2 常见的行业知识图谱

4.2.3 行业知识图谱的构建

4.2.4 行业知识图谱的应用

4.2.5 应用案例

第5章 图数据库——基于图的大数据管理

 5.1 图数据库简介

5.1.1 大图数据

5.1.2 OLTP与OLAP

5.1.3 图数据模型

5.1.4 图查询语言

 5.2 主流图数据库和图计算引擎

5.2.1 最流行的图数据库——Neo4j

5.2.2 分布式图数据库——Titan

5.2.3 基于RDF三元组库的图数据库——Blazegraph

5.2.4 基于Pregel框架的图计算引擎——Giraph、Hama、GraphLab、GraphX

 5.3 图数据库关键技术

5.3.1 图数据库的存储

5.3.2 图数据库的索引

5.3.3 图数据库的查询处理

 5.4 图数据库应用

5.4.1 语义万维网

5.4.2 社会网络

5.4.3 生物信息学

第6章 内存计算——高速大数据处理的核心技术

 6.1 内存计算技术的一个误区

 6.2 TimesTen的设计思路

 6.3 Apache Spark的设计思路

 6.4 SAP HANA的设计思路

 6.5 YunTable 4.0的产品介绍

6.5.1 整体架构与核心技术

6.5.2 MPP

6.5.3 列存2.0

6.5.4 动态数据分发

6.5.5 内存计算

6.5.6 性能和路线图

 6.6 总结

第7章 分布式存储系统——大数据存储支撑技术

 7.1 大数据对存储系统带来的挑战及其引发的变革

 7.2 谷歌文件系统(GFS)

7.2.1 支持大数据集存取和离线批处理的分布式存储系统

7.2.2 GFS架构分析

7.2.3 系统交互

7.2.4 主节点的设计

7.2.5 容错和诊断

7.2.6 小结

 7.3 支持海量数据和大规模并发访问的分布式对象存储OpenStack Swif

7.3.1 互联网化带来新的存储需求

7.3.2 OpenStack Swift的特点

7.3.3 Swift的数据模型和架构

7.3.4 Swift的API

第8章 大数据安全技术

 8.1 差分隐私保护方法简介

 8.2 差分隐私研究保护方向——数据发布和数据挖掘

8.2.1 基于差分隐私保护的数据发布(DPDR)

8.2.2 差分隐私保护数据挖掘(DPDM)

 8.3 常见隐私保护方法

8.3.1 差分隐私保护分类方法

8.3.2 差分隐私保护聚类方法

8.3.3 差分隐私频繁模式挖掘

 8.4 应用案例和原型系统

 参考文献

第9章 众包——数据来源与质量保证

 9.1 众包

9.1.1 众包的概念和模型

9.1.2 众包的优劣分析

 9.2 众包的关键技术

9.2.1 众包流程

9.2.2 任务设计

9.2.3 任务分配

9.2.4 任务动态优化

9.2.5 众包激励机制

9.2.6 众包质量保障

 9.3 众包的成功案例和平台

9.3.1 知识百科众包

9.3.2 数据众包

9.3.3 创新众包

9.3.4 软件众包

9.3.5 众筹

9.3.6 通用智力劳动众包

9.3.7 中国的众包平台

 9.4 众包研究趋势

 9.5 总结和展望

参考文献

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/7 12:12:56