Genome annotation

基因组注释

 

    者:Jung Soh   Paul M.K.Gordon

          Christoph W.Sensen

 

社:CRC Press

号:Q343.1/G664/2013/Y

藏书地点:武大外教中心

 

基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。从基因组序列预测新基因,现阶段主要是3 种方法的结合: (1) 分析mRNA EST数据以直接得到结果; (2) 通过相似性比对从已知基因和蛋白质序列得到间接证据[1] ; (3) 基于各种统计模型和算法从头预测。对预测出的基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基因注释: (1) 序列数据库相似性搜索; (2) 序列模体(Motif) 搜索; (3) 直系同源序列聚类分析(Cluster of orthologousgroup ,COG) [2] 。随着微生物全基因组序列测定速率的加快,开发有Web 接口的高效、综合基因组注释系统十分必要。近年来,国际上已有一些这样的工具,如基于Java 的微生物基因组数据库接口。尽管JMGD 提供了一个很好的图形化接口程序,却并不具有基因组自动注释功能。基因组注释主要包括四个研究方向:重复序列的识别、非编码RNA的预测、基因结构预测和功能基因注释。

本书共由十一章内容构成。第一章对DNA测序技术进行了详细的介绍,包括DNA测序技术的进化、DNA序列装配方法、下一代测序技术、错误率等多个方面。第二章阐述的是编码序列预测,mRNA绘图、统计模型、跨物种的方法、剪切变异体等内容都涵盖其中。第三章的主题是基因间区域,作者在本章详细描述了转录因子、RNA、假基因、其他重复序列等多方面内容。第四章阐述的是基因组相关数据,包括宏基因组学、单个基因组、表观遗传、单核苷酸多态性等。早期通过生物信息学对基因功能的描述是第五章要介绍的内容,涵盖了独立工具及早期互联网工具、软件包、从FASTA文件到注释的基因组等。作者在第六章详细的描述了基因组数据可视化的技术和工具,包括序列数据的可视化、多重序列比对的可视化、分层结构的可视化、基因表达数据的可视化等几个方面。第七章的主题是功能注释,生物物理及生物化学特征预测、蛋白质域、相似性搜索等内容都涵盖其中。第八章的主题是自动注释系统,包括MAGPIEAgeSENSEMBL等几个方面。第九章对动态注释系统进行了详细的描述,基于网络的基因组注释浏览器、独立基因组注释浏览器、基因组比对的可视化等内容都涵盖其中。第十章阐述的是基于网络的工作流程。第十一章对下一代测序数据的分析途径进行了介绍,基因组序列的识别、分析方法是本章主要阐述的内容。

  随着第三代测序技术的飞速发展,会有越来越多的生物的基因组序列被测定,因此对这些测序数据的解读也变得至关重要。怎样从这些海量的数据中得到有用的信息,需要基因组注释的方法和技术。本书作者共通过十一章的内容,对基因组注释中的数据分析、数据可视化、自动注释系统、动态注释系统等多个方面的内容进行了详细的描述,内容丰富。本书主要针对的是从事基因注释相关研究的科研人员和学生,同时也能给对该领域感兴趣的读者带来很大益处。

 

本书目录

前言

作者

贡献者

第一章    DNA测序技术

第二章    编码序列预测

第三章    基因间区域

第四章    基因组相关数据

第五章    通过生物信息学对基因功能的描述:早期

第六章    基因组数据可视化的技术和工具

第七章    功能注释

第八章    自动注释系统

第九章    动态注释系统:终端用户驱动的注释和可视化

第十章    基于网络的工作流程

第十一章 下一代测序数据的分析途径

索引

(郑银珍)