![]()
内容推荐 本教程的所有实践内容主要围绕基因组测序分析来设计。实践项目的主要内容包括基因组测序模拟、序列组装、全基因组的同源搜索、从头预测基因及结构建模、基于转录组测序数据的基因组注释、启动子等基因组序列特征的分析和预测、基因组数据的可视化、多种基因组序列分析软件的对比和综合运用等。这些实践内容不仅涉及基因组信息学方面常用数据库的检索,还包含常用软件的使用以及编程和数据统计方法的综合运用。 本教程主要适用于生物信息学专业本科学生的基因组信息学方面的实践教学。这些实践项目的开展,需要学生具备一定的生物信息学方面的基础理论知识和操作技能、计算机基础、Python编程与基于R语言的统计分析能力。本教程所涉及的分析软件大多适用于UNIX/Linux系统,故而还需要熟悉此类操作系统环境,同时安装好实践项目中所需要的各种专业软件。这些软件的快速安装方法见绪论第四部分“操作环境”,其使用方法见“常用软件使用手册”部分。此外,由于实践内容涉及高通量计算,故而还需一台高性能的计算设备。考虑到不同软件对计算性能的需求和实践教学的目的,对于实践内容所涉及的目标物种基因组,建议根据自身所配备的计算机设备进行选择。本教程基于一个注释信息完善的小规模基因组,提供基础实践演示案例。 目录 绪论 第一篇 基础实践 项目1 基因组测序模拟 项目2 序列组装 项目3 基因组注释之同源基因搜索 项目4 基因组注释之从头预测与基因结构建模 项目5 基因组注释之DNA元件预测 项目6 基因组数据可视化 第二篇 扩展实践 项目1 高通量测序平台及模拟工具的对比 项目2 基因组序列组装软件的对比 项目3 RNA-Seq数据从头组装软件的对比 项目4 从头计算预测基因软件的比较 项目5 基于转录组数据的新基因和转录变异体的发现 项目6 基因转录调控分析 项目7 基因组测序可视化工具的对比 第三篇 综合实践 项目1 基因组测序模拟的编程实现 项目2 同源基因搜索指导的基因结构预测 项目3 基于RNA-Seq数据的基因组注释 项目4 基于多重数据源的基因结构特征训练和应用 项目5 基因结构特征模型参数的编程实践 项目6 多重证据联合的基因结构建模 项目7 转录因子调控机制分析 其他综合实践设想 第四篇 常用软件使用手册 1.ART 2.Augustus 3.BamTools 4.BCFtools 5.bedtools 6.Bowtie2 7.FastQC 8.GFF格式处理工具 9.NCBI BLAST 10.NCBI SRA Toolkit 11.QUAST 12.Samtools 13.SOAPdenovo 14.Trimmomatic 15.Trinity 16.文件格式转换工具 附录 附录1 基因组坐标体系 附录2 常用数据格式 |