基因表达数据库的分析——方法与软件
The Analyze of Gene Expression Data
——Method and Software

作者: [美] Giovanni Parmigiani Elizabeth S. Garrrtt [美] Rafael A. Irizarry Scott L. Zeger

出版:

索书号: Q786/A532/2003/Y

藏书地点: 武大外教中心

自DNA双螺旋结构提出以来,生物科学似乎一下子找到了自己生长所需的Vitamin,开始以日新月异的速度发展,同时也带动相关学科(如化学,物理学,计算机科学,统计学等)的不断前进,以致于人们惊呼:21世纪是生物的世纪。


诚然,人类进入新世纪以来,我们取得了巨大的成就。计算机科学的发展,各种与生物相关的软件的应用,使生物信息学得以确立并获得发展;与此同时,人类基因组测序计划的完成,使人们步入了后基因组时代。从此,传统的生物学研究有了改观,开始出现了反向遗传学,这就使人们不仅可以从DNA-mRNA-Protein (正向遗传学) ,而且可以从Protein-mRNA-DNA(反向遗传学)的方向上对基因这一生命的核心进行研究,这就开创了蛋白质组研究的新篇章。


然而,二十一世纪人类需要解决的生物学的根本难题是“遗传语言”的问题,即基因表达调控的问题。正是基于这一问题的认识,对一个基因表达量的检测,是人们在体内或体外表达系统中研究基因表达以及对人类生理或遗传病研究中不可或缺的重要步骤。随着分子生物学的发展,人们创立了许多测量基因表达的方法,包括基因表达的序列分析(SAGE),CNDA文库测序,CDHA扣除,多重定量RT-PCR,和DNA微阵列等,并由此产生了大量信息,对这些生物信息进行快速有效的处理是当前生物学研究人员面临的又一挑战。
本书正是鉴于这一新的需求,对当前生物学研究者在基因表达量检测中最常用也是最重要的技术——基因表达的微阵列,进行了全面的讲述。DNA微阵列就是把DNA固定在玻璃、塑料或尼龙膜上,然后通过测定它们与研究样品中 mRNA的杂交或配对情况,进而确定基因的表达水平。它是分子生物学试验技术的一个重大突破,利用该技术可以对成千上万个基因的表达水平进行分析,利用该技术我们已经产生了总量巨大的有用数据,然而分析与整理这些数据却成为利用这一技术的瓶颈问题。原始的微阵列数据是图像,必须把它们转化成基因表达阵矩表,阵矩的行代表基因,列代表样本及条件(如组织条件、实验条件、处理条件等),每个格子得数据表示特定的基因在特定的样本中的表达水平。这些矩阵必须经过进一步的分析才能得到它们潜在生物学过程的信息。因此,基因表达微阵列技术虽然具有广泛的用途,但测量过程中的任何变化或阵列构建、mRNA的准备、杂交、图像扫描、图像分析过程中的每一步失误都可能导致杂交信号的模糊,这就使得我们对基因表达微阵列技术的学习显得尤为重要。


本书不仅制作精美,条理清晰,布局合理,综合性强,知识全面新颖,而且为初学者进行快速学习和掌握相关技术提供了捷径,为人们在众多的生物软件中以及正确解释实验结果过程中选择正确的软件和统计学方法提供了指导。全书的所有章节都是有一些长期从事微阵列数据分析的统计学软件的开发人员编写的,详细地介绍了基因表达微阵列的应用方法。每一章都对相应的数据分析工具以及它们的软件应用在概念和方法上进行了全面详尽地论述。对于全书所录入的软件,使用者都可上网下载,免费使用。
书中还穿插了大量的图片,彩页,帮助读者了解学习,同时还向读者介绍了许多相关的软件和生物学网站,以便于读者更多更快的了解和学习相关知识。对于其中一些网络工具的应用,作者们将其在电脑上的运作过程直接呈现在书面上,这一直观生动的编制方法,对于想掌握这些应用工具的初学者来说,具有生动、易懂的特点。在排版上,该书对每一章要传达的中心意思在摘要中都进行了简洁全面的介绍。文章末尾讨论和大量参考文献的录入,不仅给读者以思考的空间,也可以进一步引导读者了解相关主题。


该书所介绍的方法涵盖了微阵列数据统计分析的各个方面,从注释和过虑到集合和分类都进行了介绍。全书共分为19章,涉及到100多个主题,各个主题的安排也合乎逻辑,读者可以从其中任意一章切入阅读。第一章是全书的缩影,综合的介绍了基因表达数据分析的方法和软件,简单介绍了与微阵列有关的数据分析,并引导读者了解哪一章对相应的软件做了说明;第二章,基因组实验的注释和解释着重介绍了多重微阵列实验中试验结果的取舍与解释,对其中涉及的三种基本工具,即基因过滤程序、注释系统和可视化工具进行介绍;第三章,CDHA微阵列数据库分析和正常化探索分析的生物处理器R包,对四种R软件包的功能和应用、应用方法进行了介绍;第四章,对Affymetrix寡核苷酸微阵列分析的一种R软件包——Affy进行了详细的介绍;第五章则介绍了另一种软件包—基因芯片处理器(dChip)的应用方法和范围;第六章着重向我们讲述了基因表达数据或功能基因组数据进行分析和解释的一种系列工具——表达模拟器(Expression Profiler);第七章描述了有助于我们对分化表达进行分析和显示的S-PLUS文库,通过本章的学习,我们将学会对具有相似表达值的基因间或多重微阵列间的一些错误表达进行估计。


第八章和第九章则对DRAGON网络和网页工具SNOMAD——两种与微阵列数据处理有关的内容进行了阐述;第十章作者向我们展示了一种可独立运行于Java上的数据开发工具——微阵列资源管理器的功能和使用方法。第十一章讲述了利用经验参数舱对微阵列进行分析的方法;第十二章则介绍了与DNA微阵列中对分化基因进行检测相关的SAM入门程序,通过SAM,我们可以对检测中的错误进行评估。第十三章向我们推荐了使用微阵列数据对目的基因进行筛选的方法,通过这一手段,我们可以对一些表达信号很低的重要基因(如编码某些转录因子或受体的基因)进行检测;第十四章中描述了MAANOVA软件包在斑点CDNA微阵列实验分析中的应用;第十五章,作者介绍了一种新的基因集合技术——基因刨(Gene Shaving),该技术与其他基因集合技术相比,具有发现重叠基因的优点。第十六章作者又给我们介绍了一种新的软件——POE,它为我们提供了基因表达定性分析的统计学方法。第十七章主要讲述了贝叶斯定理的分解应用,为研究细胞通路中重叠应答和一些修饰提供了新的方法。第十八章作者介绍了基因表达动力学集合模型的贝叶斯方法,详尽叙述了其操作和相关软件的应用方法。本书的最后一章,介绍了另一种研究功能基因组的技术——关联网络,它是我们在微阵列数据库中发现遗传调控网络的第一步,与其他相关处理方法相比,它具有更加优越的特点。


本书是特别为在计算机科学、生物统计学、生物信息学和医学等领域从事微阵列数据分析的人员而编写的,绝大部分篇章是适合于具有硕士水平人员进行该方面的知识学习的,还有部分篇章是为博士生和相关研究人员而编写的。但由于该书的简洁易懂的特点,我们认为任何对该领域感兴趣的人都可以利用本书进行相关知识的学习。

(武汉大学生命科学学院研究生 周棋赢)