本书着重研究基因表达谱的各种数据挖掘方法,主要是将很多智能计算的方法与技术应用到肿瘤分类中,全书包含了理论、方法、步骤、程序代码、实验结果与分析,以及多种方法的结果比较,同时以图形和表格的形式给出了大量的实验结果,很多方法具有通用性。本书大部分内容是作者和作者所在的实验室的最新研究成果,凝聚了作者所在实验室全体工作人员的心血和才智。读者可按照书中的方法步骤和附录中提供的程序代码容易进行仿真实验。
基因表达谱数据挖掘可以帮助人们发现新的疾病亚型,提高复杂疾病诊断的正确率。因此,发展高效实用的基因表达谱数据处理方法具有十分重要的实际意义。本书首先介绍生物信息学中基因芯片和基因表达谱等一些基本概念,然后利用Relief、Fisher判别、Wileoxon和Kruskal-Waltis秩和检验方法、信噪比方法、主成分分析方法、因子分析方法、独立分量分析方法、经典粗糙集和邻域粗糙集、人工神经网络和集成神经网络、小波包变换和离散余弦变换、遗传算法和遗传规划、流形学习、张量分析等方法,系统研究了基于基因表达谱的肿瘤亚型数据挖掘方法(包括特征提取与分类识别等)。设计多种基因表达谱分类识别算法,并结合SVM、NSC、FLDA、DLDA等多种分类器及集成分类器,进行大量的基因表达谱分类识别实验,以图和表的形式给出大量实验结果,同时对各种方法的性能进行比较。系统研究基于基因调控概率的肿瘤基因表达谱数据挖掘方法,结合Filter和Wrapper两种特征选择方法的优点,研究基于支持向量机和惩罚策略(SVPS)的肿瘤关键基因选择算法。设计基于标准遗传算法和多目标遗传算法的集成基因表达谱特征选择方法。
本书适合国内高校和科研院所生物和信息领域中从事生物信息学教学和研究的教师、高年级本科生、研究生和科技人员,对于其他与生物信息学研究有关及有志于从事这一领域研究的计算机科研人员也是必备的参考读物。
前言
第1章 绪论
1.1 生物信息学简介
1.1.1 生物信息学概念
1.1.2 生物信息学的研究背景和意义
1.1.3 生物信息学的研究内容与方法
1.1.4 生物信息学的研究历史和现状
1.1.5 应用前景
1.2 基因组时代简介
1.2.1 基因组计划
1.2.2 基因的基本结构
1.3 基因表达谱数据挖掘的研究意义与研究现状
1.3.1 研究意义
1.3.2 研究现状
1.4 本章小结
参考文献
第2章 DNA微阵列技术与基因表达谱
……
第3章 基因表达谱数据挖掘中的模式识别基础
第4章 基于因子分量分析的基因表达谱特征提取方法
第5章 基于傅里叶与小波包变换的基因表达谱特征提取方法
第6章 信息基因的启发式搜索算法研究
第7章 基于粗糙集的信息基因选择方法
第8章 基于基因调控概率模型的基因表达谱数据挖掘方法
第9章 基于神经网络和支持向量机的基因选择及肿瘤分类方法
第10章 基于集成分类器系统的基因表达谱数据挖掘方法研究
第11章 基于流形学习的基因表达谱特征提取方法
第12章 基于张量分析的高阶基因表达谱特征提取方法
附录 部分源代码
彩图