![]()
内容推荐 本教材基于数据技术概念的提出,建立由数据生成、数据组织管理与数据信息汲取三个模块构成的数据技术应用全流程体系框架。通过对计算机信息系统、抽样技术与数据库系统等基础技术原理的概念化解读,以及对网络爬虫与文本数据生成、SQL语言、数据预处理、回归模型、Logistic建模、关联规则、决策树分类规则、K-平均聚类、神经网络、支持向量机,集成学习、数据可视化等一系列代表性经典应用技术的提出意义、基本概念与操作规则的分层讲授逻辑构建,并通过技术应用综合系统示例,为非计算机和非统计专业的各领域人员的数据素质培养提供一个学习平台。其中,代表性经典技术的分层讲授逻辑,可满足读者自主选择学习内容的要求。 《数据技术应用概论》是为落实国家大数据战略人才培养与教育部新文科建设要求,以经济管理类大学本科学生数据素质培养为目标编写的一部通识教材,也可作为其他领域人员大数据应用学习的参考用书。 作者简介 尚翔,男,任职于天津财经大学管理信息系统系。主要研究方向为数据库、数据仓库、数据挖掘技术的研究与应用。目前主要从事有关人口信息系统及人口与经济发展理论及方法的研究。曾发表论著《企业战略决策最佳路径理论研究》;主持了天津市科委项目“主动数据库中间件系统”的开发工作。 目录 第1章 绪论 1.1 数据素质培养意义 1.2 数据技术 1.3 数据技术应用体系框架 主要参考文献 第一篇 数据生成 第2章 计算机信息系统 2.1 计算机信息系统的构成 2.2 计算机信息系统的技术路线 主要参考文献 第3章 抽样技术 3.1 抽样调查 3.2 网络调查和电话调查 3.3 抽样学习 3.4 抽样技术的相关概念 主要参考文献 第4章 网络爬虫与文本数据生成 4.1 网络爬虫概述 4.2 网络爬虫技术操作 4.3 文本数据生成 主要参考文献 第二篇 数据组织管理 第5章 数据库技术 5.1 数据库技术概述 5.2 数据库系统开发 5.3 关系数据库 5.4 数据仓库 主要参考文献 第6章 SQL语言 6.1 SQL概述 6.2 SQL关系定义 6.3 SQL查询基本结构 6.4 数据库修改 6.5 视图 主要参考文献 第7章 数据预处理技术 7.1 数据清理 7.2 数据集成 7.3 数据归约 7.4 数据变换 7.5 数据离散化和概念分层 主要参考文献 第三篇 数据信息汲取 第8章 回归模型 8.1 回归模型的基础知识 8.2 最小二乘法 8.3 其他常用回归模型 主要参考文献 第9章 Logistic建模技术 9.1 Logistic建模技术的基础知识 9.2 梯度上升算法 9.3 其他常用的Logistic模型 主要参考文献 第10章 关联规则挖掘 10.1 关联规则挖掘的基础知识 10.2 Apriori算法 10.3 其他常用关联规则挖掘算法 主要参考文献 第11章 决策树分类规则 11.1 决策树分类规则的基础知识 11.2 ID3算法 11.3 其他常用的决策树分类规则算法 主要参考文献 第12章 K-平均聚类 12.1 K-平均聚类的基础知识 12.2 基于划分的K-平均聚类算法 12.3 其他常用的聚类算法 主要参考文献 第13章 神经网络 13.1 神经网络的基础知识 13.2 BP算法 13.3 其他常用的神经网络算法 主要参考文献 第14章 支持向量机 14.1 支持向量机的基础知识 14.2 支持向量机的SMO算法 14.3 其他常用的支持向量机算法 主要参考文献 第15章 集成学习算法 15.1 集成学习算法的基础知识 15.2 随机森林算法 15.3 其他常用的集成学习算法 主要参考文献 第16章 数据可视化 16.1 数据可视化的基础知识 16.2 可视化设计基础 16.3 数据可视化工具 主要参考文献 第四篇 示例 第17章 系统示例 17.1 数据生成 17.2 数据组织管理 17.3 数据信息汲取 |