章R语言介绍 1
1.1什么是R语言1
1.2为什么使用R分析数据1
1.3R的下载与安装2
1.4启动和退出R2
1.5RStudio3
1.6R包4
1.6.1什么是包4
1.6.2包的安装5
1.6.3包的使用和更新5
1.7开始使用R5
1.7.1获取帮助5
1.7.2把R当作一个计算器6
1.7.3R对象8
1.8工作空间管理11
1.9小结12
1.10习题12
第2章创建数据集14
2.1R的数据结构14
2.1.1向量14
2.1.2因子16
2.1.3矩阵17
2.1.4数组19
2.1.5列表20
2.1.6数据框21
2.1.7数据类型的转换22
2.2用R获取数据23
2.2.1获取内置数据集23
2.2.2模拟特定分布的数据24
2.2.3获取其他格式的数据25
2.2.4导出数据26
2.2.5用rio包导入和导出数据26
2.3数据录入27
2.4小结28
2.5习题30
第3章数据框的操作31
3.1用基本包处理数据框31
3.1.1查看数据框里的内容31
3.1.2选取数据框的子集34
3.1.3将数据框按照某个变量的值排序35
3.1.4查找和删除重复数据36
3.1.5在数据框中添加和删除变量37
3.1.6把数据框添加到搜索路径38
3.2用dplyr包处理数据框39
3.2.1使用filter()和slice()筛选行40
3.2.2使用arrange()排列行41
3.2.3使用select()选择列42
3.2.4使用mutate()添加新变量43
3.2.5使用summarise()计算统计量43
3.2.6使用group_by()拆分数据框44
3.2.7使用传递符“%>%”组合多个操作45
3.3数据框的合并46
3.3.1纵向合并46
3.3.2横向合并47
3.3.3按照某个共有变量合并47
3.4数据框的长宽格式的转换48
3.5缺失值的处理50
3.5.1识别缺失值50
3.5.2探索数据框里的缺失值51
3.5.3填充缺失值52
3.6处理大型数据集的策略55
3.6.1清理工作空间55
3.6.2快速读取.csv文件55
3.6.3模拟一个大型数据集56
3.6.4剔除不需要的变量57
3.6.5选取数据集的一个随机样本58
3.7小结58
3.8习题60
第4章数据可视化62
4.1用R的基础绘图系统作图62
4.1.1函数plot()62
4.1.2直方图和密度曲线图63
4.1.3条形图65
4.1.4饼图67
4.1.5箱线图和小提琴图67
4.1.6克利夫兰点图68
4.1.7导出图形69
4.2用ggplot2包作图70
4.2.1初识ggplot2包70
4.2.2分布的特征74
4.2.3比例的构成76
4.2.4用函数ggsave()保存图形78
4.3其他图形78
4.3.1金字塔图78
4.3.2横向堆栈条形图79
4.3.3热图79
4.3.4三维散点图80
4.3.5词云图81
4.3.6动态图形82
4.4小结83
4.5习题85
第5章基本统计分析86
5.1数值型变量的描述性统计分析88
5.2分类变量的列联表和独立性检验91
5.2.1生成频数表和列联表91
5.2.2独立性检验96
5.3连续型变量组间差异的比较101
5.3.1独立样本的t检验101
5.3.2非独立样本的t检验102
5.3.3单因素方差分析103
5.3.4组间差异的非参数检验105
5.4用函数tablestack()汇总双变量分析结果106
5.5变量间的相关性111
5.5.1连续型变量间的相关性111
5.5.2分类变量间的相关性114
5.5.3相关性的可视化115
5.6小结118
5.7习题120
第6章线性回归分析122
6.1简单线性回归122
6.1.1拟合简单线性回归模型123
6.1.2模型输出结果的解释124
6.1.3回归诊断126
6.2分层线性回归129
6.3多重线性回归133
6.3.1拟合多重线性回归模型133
6.3.2多重共线性135
6.3.3逐步回归136
6.3.4回归诊断139
6.4小结140
6.5习题141
第7章Logistic回归分析142
7.1二分类Logistic回归142
7.1.1Logistic回归模型142
7.1.2Logistic回归实例143
7.1.3表格数据的Logistic回归151
7.2条件Logistic回归155
7.3无序多分类Logistic回归157
7.4有序Logistic回归161
7.5小结166
7.6习题167
第8章Poisson回归分析168
8.1Poisson回归模型168
8.2过度离散的判定及处理171
8.3对数线性模型174
8.4小结178
8.5习题178
第9章生存分析180
9.1生存对象180
9.2生存率的估计与生存曲线182
9.3生存率的比较184
9.4Cox回归186
9.4.1建立Cox回归模型186
9.4.2比例风险假定的检验188
9.4.3生存的预测188
9.5小结190
9.6习题190
0章聚类分析192
10.1相似性的度量192
10.1.1样品间的距离192
10.1.2变量间的相似系数195
10.2层次聚类法196
10.2.1类之间相似系数的定义196
10.2.2Q型聚类196
10.2.3R型聚类203
10.3k均值聚类法204
10.4小结206
10.5习题207
1章判别分析209
11.1距离判别209
11.2K最邻近判别213
11.3Fisher判别215
11.4Bayes判别218
11.5小结219
11.6习题220
2章主成分分析和因子分析221
12.1主成分分析221
12.1.1主成分的定义221
12.1.2主成分的求解222
12.1.3主成分分析的注意事项226
12.2因子分析226
12.2.1因子分析模型的定义226
12.2.2因子分析模型的求解227
12.2.3因子旋转229
12.2.4因子分析的注意事项231
12.3小结232
12.4习题233
3章临床诊断试验评价234
13.1二分类结果的评价指标234
13.1.1灵敏度和特异度234
13.1.2预测值235
13.1.3图解灵敏度、特异度、阳性预测值和阴性预测值235
13.1.4诊断试验的综合评价指标236
13.2ROC及曲线下面积237
13.2.1单个ROC分析237
13.2.2两个ROC的比较240
13.2.3Logistic回归的ROC曲线241
13.3联合试验243
13.4小结244
13.5习题244
4章Meta分析245
14.1Meta分析的基本步骤245
14.2Meta分析的常用统计方法246
14.3二分类变量资料的Meta分析247
14.3.1OR、RR或RD的合并248
14.3.2发表偏倚的识别251
14.3.3敏感性分析253
14.4连续型变量资料的Meta分析254
14.5Meta分析的注意事项255
14.6小结256
14.7习题256
习题参考答案258
参考文献273
函数索引274