内容推荐 面对日渐复杂的大数据,科技工作者很难用单一的统计软件高效、完美地完成从数据挖掘、数据清洗、统计分析到结果呈现的全部工作,因此需要熟悉和掌握多种统计工具,各取所长、整合使用。本书立足于大数据研究的现状,基于实际医疗案例,介绍数学基础知识和统计学基础知识,SAS、R语言、Stata和Python这4款大数据常用分析工具的基础编程知识及实践操作。 本书主要面向在校本科生、研究生,以及要掌握SAS、R语言、Stata和Python的数据工作者,熟悉四个软件的任意一个且想要在短时间内掌握其他软件的读者,也适合医科学生、临床医生或药企人员等医疗相关人员学习使用。 目录 第1章 数学基础 1.1 常用的数学符号 1.2 常见概念 1.2.1 集合 1.2.2 极限 1.3 微积分 1.3.1 导数与微分 1.3.2 基本初等函数的导函数和微分公式 1.3.3 导数与微分的运算法则 1.3.4 定积分与不定积分 1.3.5 基本的不定积分公式 1.3.6 定积分与不定积分的性质 1.4 线性代数 1.4.1 标量与向量 1.4.2 矩阵与线性方程组 1.4.3 行列式的定义与运算 1.4.4 矩阵的运算法则 1.4.5 特殊的矩阵 1.4.6 矩阵的秩 1.4.7 矩阵的转置与矩阵的逆 1.4.8 特征向量与特征值 第2章 统计学基础 2.1 概率论的基本概念 2.2 随机变量与分布 2.2.1 随机变量 2.2.2累积分布函数222.2.3概率函数 2.3 随机变量的数学特征 2.3.1 数学期望 2.3.2 期望值的规律 2.3.3 条件期望 2.3.4 协方差与相关系数 2.3.5 样本均值和方差 2.4 常见的随机变量分布 2.4.1 离散变量分布 2.4.2 连续变量分布 2.5 统计学基本概念 2.5.1 总体与样本 2.5.2 参数和统计量 2.5.3 中心极限定理 2.6 统计描述 2.6.1 定量资料的统计描述 2.6.2 分类资料的统计描述 2.7 统计推断 2.7.1 参数估计 2.7.2 假设检验 2.8 多因素回归模型 2.8.1 多因素线性回归模型 2.8.2 多因素Logistic回归模型 2.8.3 多因素Cox回归模型 第3章 软件基础总论 3.1 软件初识 3.1.1 SAS 3.1.2 R语言 3.1.3 Stata 3.1.4 Python 3.24 个软件的比较 第4章 SAS基础 4.1 SAS介绍与资源 4.1.1 SAS语言及程序结构 4.1.2 SAS工作界面 4.1.3 获得帮助 4.2 数据的导入与导出 4.2.1 导入数据 4.2.2 导出数据 4.3 SAS中常用的函数 4.3.1 字符型函数 4.3.2 数值型函数 4.3.3 日期型函数 4.3.4 特殊函数 4.3.5 其他函数 4.4 SAS变量 4.4.1 变量属性 4.4.2 自动变量 4.4.3 变量列表的缩写规则 4.4.4 创建变量 4.4.5 改变变量属性 4.4.6 改变变量类型 4.5 SAS数据处理 4.5.1 选取变量 4.5.2 创建变量 4.5.3 对观测求和 4.5.4 选取并操作部分观测 4.5.5 循环和数组 4.5.6 数据集的横向合并和纵向合并 4.5.7 增加数据集处理灵活性的SAS选项 4.6 SAS中常见的proc步 4.6.1 proc contents 4.6.2 proc datasets 4.6.3 proc freq 4.6.4 proc means 4.6.5 proc sort 4.6.6 proc transpose 4.6.7 proc univariate 4.6.8 proc corr 4.6.9 proc reg 4.6.10 proc logistic 4.6.11 proc lifetest 4.6.12 proc phreg 4.7 PROC SQL 4.7.1 检索数据 4.7.2 合并数据集 4.7.3 使用PROC SQL管理表 4.8 SAS宏介绍 4.8.1 宏变量 4.8.2 宏函数 4.8.3 宏程序 4.8.4 宏参数 4.8.5 宏语言与data步 4.8.6 宏语言与PROC SQL 4.8.7 条件语句和循环语句在宏语言中的使用 第5章 R语言基础 5.1 R语言介绍 5.1.1 R语言的特点与资源 5.1.2 RStudio使用简介 5.2 R语言的基本规则 5.2.1 对象 5.2.2 函数使用基础 5.2.3 扩展包 5.2.4 帮助 5.3 数据类型 5.3.1 vector 5.3.2 factor 5.3.3 date 5.3.4 matrix 5.3.5 list 5.3.6 data.frame 5.3.7 formula 5.4 常用函数介绍 5.4.1 数据的读入和导出 5.4.2 条件判断 5.4.3 循环 5.4.4 文本处理 5.4.5 基本作图 5.4.6 自定义函数 5.5 常用数据处理与统计分析函数 5.5.1 单变量分析 5.5.2 双变量、多变量分析 5.5.3 线性回归模型 5.5.4 Logistic回归模型 5.5.5 生存分析模型 5.6 dplyr包简介 5.6.1 安装dplyr包 5.6.2 dplyr包中最常用的5个函数 5.6.3 用%>%运算符连接多个函数 5.6.4 dplyr包中其他实用的函数 5.7 ggplot2包简介 5.7.1 安装ggplot2包 5.7.2 使用ggplot2画图的基本思路 5.7.3 使用geom_histogram函数绘制直方图 5.7.4 使用geom_bar函数绘制柱状图 5.7.5 使用geom_boxplot函数绘制箱形图 5.7.6 使用geom_point函数绘制散点图 5.7.7 使用geom_smooth函数在散点图上添加线性回归结果 5.7.8 对图中细节进行微调 5.7.9 将多个图合并为一个图 5.7.10 保存图 第6章 Stata基础 6.1 Stata简介 6.1.1 界面介绍 6.1.2 在菜单栏中选择命令 6.1.3 输入命令代码 |