内容推荐 本书共9章。章介绍多标签预测的研究现状和进展,并且着重从生物信息学的角度阐述多标签算法的特点及已有相关算法存在的不足;然后介绍本体数据库研究和应用的概况,分析其现阶段存在的主要问题。第2章介绍本体的基本概念以及常用的本体数据库。第3章介绍ChEBI和GO数据库的语义挖掘方法。第4章介绍当前经典的几种多标签算法。第5~8章应用GO数据库和ChEBI数据库数据,提取相关蛋白质和药物的特征信息,使用多标签机器学习算法创建蛋白质亚细胞定位预测服务器和药物ATC类别预测服务器。第9章为总结和展望。 本书适用于高等院校生物信息、人工智能、计算机应用等相关专业学生阅读及技术人员参考。 目录 章绪论 1.1引言 1.2生物信息中的多标签问题 1.3本体论方法的介绍 第2章本体和本体数据库 2.1本体简介 2.2本体数据库 2.2.1GO数据库 2.2.2ChEBI数据库 2.3本章小结 第3章ChEBI和GO数据库的语义挖掘方法 3.1基于分类图形结构的相似方法 3.2基于信息内容的相似方法 3.3度量基因之间功能相似性的方法 3.4本体在生物医药领域的应用及已经开发的工具和语言 3.5本章小结 第4章多标签算法 4.1多标度(Multiplicity Degree) 4.2多标签评价指标 4.3几种经典的多标签算法 4.4本章小结 第5章预测药物ATC类别模型一:iATC-mISF 5.1基准数据集 5.2预测模型iATC-mISF的构建 5.3结果与讨论 5.4本章小结 第6章预测药物ATC类别模型二:iATC-mHyb 6.1基准数据集 6.2预测模型iATC-mHyb的构建 6.3结果和讨论 6.4本章小结 第7章pLoc-mAnimal:动物蛋白质亚细胞定位预测模型 7.1基准数据集 7.2特征降维 7.2.1特征选择 7.2.2特征抽取 7.2.3新创建的特征降维方法――Bayes统计特征降维方法 7.3蛋白质向量构造 7.3.1使用Bayes统计特征降维方法构造GO功能注释向量 7.3.2使用蛋白质氨基酸序列构造Grey-PSSM向量 7.4结果和讨论 7.5本章小结 第8章pLoc-mPlant:植物蛋白质亚细胞定位预测模型 8.1基准数据集 8.2集成学习 8.3植物蛋白质亚细胞位置预测模型 8.4结果与讨论 8.5本章小结 第9章总结和展望 9.1总结 9.2展望 9.2.1老药新用 9.2.2西药按中医系统理论分类 9.2.3蛋白质亚细胞位置定位的非平衡问题 参考文献 |