模式识别主要是用来识别数据中的
规律与特征,目前已发展成为一门数据处
理、信息分析的专业学科。随着大数据时
代的到来,该技术已被广泛应用于天文、
物理、地质、生物学等领域。本书主要阐
述模式识别在计算分子生物学中的一些
技术与方法。目前由于DNA 测序技术、
结晶技术、组学技术的发展,已积累了海
量的生物数据。而模式识别正是系统研究
生物序列、结构、进化、生物网络等的关
键技术。本书也主要介绍了如何利用模式
识别的方法来分析这些生物数据,并从中
得到有意义的模型。
全书分七个部分,共29 章。第一部
分介绍模式识别技术在序列分析中的应
用技术,主要包括如何用模式识别技术来
解决单体型分析(第1 章)、条形码中的
问题(第2 章)、基因组的比对(第3 章)、多序列比对(第4~5 章)等内容。第二
部分模式识别技术在二级结构分析中的
应用,介绍了一些蛋白质二级结构预测的
方法(第6~7 章)、蛋白质二级结构中
功能性模体的识别方法(第8 章)、功能
性非编码RNA 的筛选(第9 章)。第三
部分,模式识别技术在蛋白质三级结构分
析中的方法与技术,介绍蛋白质三级结构
的模体查找技术(第10 章)、蛋白质三
级结构的预测方法(第11 章)、蛋白质
三级结构域间连接肽的预测(第12 章)、
蛋白质三级结构中脯氨酸顺反异构化的
预测(第13 章)。第四部分蛋白质四级
结构中的模式识别方法,主要包括蛋白质
四级结构的预测(第14 章)、四级结构
的比较(第15 章)、蛋白质相互作用的
预测方法(第16 章)等。第五部分模式
识别在基因芯片研究中的应用技术,主要
包括芯片数据的获取(第17 章)、差异
基因的鉴定(第18 章)、基因表达谱的
聚类分析(第19 章)、芯片信息的挖掘
(第20 章)等内容。第六部分模式识别
在进化树分析中的应用,主要包括进化树
的构建、重建、评估及进化树中信息的挖
掘等内容(第21~25 章)。第七部分模
式识别在生物网络的应用,主要包括生物
网络的构建(第26 章)、网络信息的推
测与挖掘(第27~28 章)、网络中蛋白
质功能的注释(第29 章)等内容。
总之,本书是一本模式识别在计算分
子生物学应用的专业书籍,并且在该书中
还包含大量关于模式识别方面的研究文
献,非常值得从事计算分子生物学、模式
识别的研究人员、技术人员和学生阅读。田健,副研究员
(中国农业科学院生物技术研究所)
Tian Jian, Associate Professor
(Biotechnology Research Institute,
CAAS)