Bromodomain-like折叠类型模板的设计

2016-10-18 08:51李晓琴张春城
北京工业大学学报 2016年10期
关键词:识别率聚类模板

李晓琴,张春城

(北京工业大学生命科学与生物工程学院,北京 100124)

Bromodomain-like折叠类型模板的设计

李晓琴,张春城

(北京工业大学生命科学与生物工程学院,北京 100124)

针对折叠类型分类中所选天然模板普适性不足的问题,提出了Bromodomain-like折叠类型模板的设计方法.选SCOPe Astral 2.03序列相似度小于40%并且分辨率高于0.25 nm的52个可用Bromodomain-like折叠样本,基于多结构比对结果及数据分析,建立了折叠类型家族模板的设计方法.利用系统聚类方法构建了家族模板的系统聚类图,提出了蛋白质折叠类型模板的设计方法,并用于该折叠类型的模板设计.结果表明:设计模板具有普适性,可用于蛋白质折叠类型分类.

折叠类型分类;模板设计;结构比对;系统聚类

蛋白质的结构能够提供蛋白质的很多信息,有助于了解蛋白质的功能和分子机制[1].目前,研究蛋白质结构的方法有2种,分别为实验测定方法和理论预测方法.实验测定蛋白质三维结构的方法主要采用X-ray晶体衍射法[2]和核磁共振波谱法.传统的基于Anfinsen“热力学假说”[3]原理的蛋白质三维结构预测方法通常可分为3类:同源模建方法、折叠识别方法和从头预测法[4-5].同源模建受到序列相似度的限制,从头计算运算量太大,介于2种方法之间的折叠识别被认为是最有前途的方法,其基本思想是:预测的蛋白质折叠类型与某一已知结构的蛋白质折叠类型相同,这样蛋白质的折叠问题就转化为在已知空间结构的蛋白质中,选择一种最有可能的折叠类型,从而大大减少了预测蛋白质三维结构的难度.尽管蛋白质空间结构预测的理论方法比较成熟,但空间结构即原子坐标的预测依然困难.

蛋白质的空间结构十分复杂,但它的框架结构(折叠类型或拓扑结构)却较为简单,粗粒意义下的蛋白质结构研究越来越得到研究者的关注[6-7].蛋白质折叠类型是一种粗粒化的结构,包括蛋白质分子空间结构的3个主要方面:二级结构单元、二级结构单元的相对排布位置、蛋白质多肽链的整个路由关系(肽链走向)[8].

研究表明,蛋白质的折叠类型也只有数百到数千种[9-10],远小于蛋白质分子折叠的自由度数,并且,蛋白质的折叠速率和折叠机制在很大程度由天然状态的拓扑所决定[11].对自然界存在的数百到数千种折叠类型进行系统研究,探索构建蛋白质折叠类型模板的方法,为进一步的蛋白质折叠类型分类及识别研究奠定基础,并有助于揭示蛋白质的折叠规律.

模板的选取是蛋白质折叠类型分类的关键问题.在以往选择模板时,通常在结构数据库中选择天然蛋白质为模板,其依据以环区结构冗余小、折叠核心清晰且结构数据所占存储空间小的天然蛋白质为模板.环区和折叠核心的清晰程度都影响预测的准确性.研究表明,模板的好坏直接影响了预测模型的好坏,即预测的模型倾向于模板的模型[12].

蛋白质的折叠类型主要由形成折叠核心的规则二级结构片段组成、排布、走向决定,蛋白质折叠类型的模板应该围绕折叠核心的的规则二级结构片段来构建.通常选取结构简单的天然样本作为模板,这样折叠核心以外的其他结构就成为折叠类型分类的干扰因素,如何去除干扰、提取反应折叠类型拓扑特征的模板成为解决折叠类型分类的关键问题之一;另外,在一个蛋白质折叠类型内部,通常会包含多了家族和多个超家族,以结构简单的天然样本为模板,该模板具有所在家族的个性化结构特征,但不足以代表折叠类型所属全部超家族样本的共性特征,模板的普适性会比较差,如何克服天然模板的局限性、提高折叠类型模板的普适性成为解决折叠类型分类的又一关键问题.

基于此,通过对数据库中Bromodomain-like折叠类型的家族分类及样本进行分析,抓住形成蛋白质折叠类型的折叠核心结构,提出了Bromodomainlike折叠类型模板的设计方法,并用于该折叠类型的模板设计.

1 材料

Bromodomain(BRD)蛋白是一种进化高度保守的约含有110个氨基酸的溴蛋白功能结构域,这个家族在人体内能够唯一特异性的识别蛋白质中的乙酰化赖氨酸(KAc)[13],使得BRD蛋白具有辨别不同蛋白结合物的能力[14-16],因此它成为蛋白质交互模块中不断探索药物发现领域的代表.大部分的BRD蛋白都在调控如组蛋白乙酰酶、依赖ATP的染色质重塑、甲基化转移酶和转录激活因子等基因转录过程中发挥重要的作用,并与肿瘤、神经紊乱、炎症、肥胖和心血管疾病发生相关[17],是近年来的研究热点.

选取Bromodomain-like折叠类型为研究对象,在SCOPe Astral 2.03数据库中其对应编号为a.29.该折叠类型为左手四螺旋束结构,包含15个超家族、20个家族.为避免冗余序列对模板设计的影响,选取序列相似度小于40%、分辨率高于0.25 nm的52样本,样本蛋白的Astral SCOPe ID如表1所示.图1为BRD蛋白质模型及拓扑结构模型.SCOPe Astral 2.03中相似度小于40%、分辨率高于0.25 nm非Bromodomain-like折叠类型样本数为12 065.

对于核磁共振样本,利用其对应的多套骨架模型信息,参照2.1家族模板设计方法,建立单骨架样本模型;对于原子信息缺失较多的样本,不用于构建,仅用于折叠类型的模板的验证.

表1 Bromodomain-like折叠类型52个样本Table 1 BRD folding type 52 samples

2 Bromodomain-like折叠类型模板设计

蛋白质折叠类型的分类以蛋白质折叠核心的规则结构片段组成、连接和空间排布为依据,其中的规则结构片段即α-螺旋或β-折叠,其骨架结构主要由α-碳原子连接而形成.因此折叠类型模板的设计就是确定折叠核心的片段并对其骨架结构的α-碳原子坐标进行建模.

2.1家族模板的设计与生成

蛋白质折叠类型所属家族模板的设计,就是确定家族样本中共同参与折叠核心形成的结构片段,并对其骨架结构的α-碳原子坐标建模,家族模板是构建蛋白质折叠类型模板的基础.

对Bromodomain-like折叠类型所属的任意家族,根据以下步骤建模:1)对家族样本进行多结构比对,获得多结构比对信息;2)对获得的多结构比对信息进行分析,确定并提取折叠核心片段;3)对折叠核心片段进行骨架结构建模.根据分类结果,家族包含有2个及2个以上样本的,依据上述步骤建模.家族内只含一个样本的,将其作为本家族的模板.家族模板设计的流程如图2所示.

家族模板的折叠核心结构通过多结构比对信息获得.多结构比对信息中,完全匹配的片段即家族样本共同参与折叠核心的片段,提取全部的匹配片段,形成该家族模板的折叠核心结构.目前结构比对算法如CE[18]、DaliLite[19]、SSM[20]、TM-align[21]、MUSTANG[22]、GOSSIP[23].本文利用MUSTANG多结构比对算法,MUSTANG是在DALI双结构比对获得成功的基础上发展的一种多结构比对方法,对于空间折叠、残基接触模式有较强的识别能力.

对由n个样本组成的家族,利用MUSTANG进行多结构比对,获得多结构比对结果,提取匹配片段,对匹配片段中任一残基i的α-碳原子匹配坐标信息——(xi,yi,zi),计算匹配坐标的平均值——将其作为该残基的骨架α-碳坐标信息,形成匹配片段的骨架坐标信息.

求坐标平均值公式为

2.2家族模板系统聚类图的建立及稳定性分析

通过家族模板的设计流程得到各个家族的模板,由于家族a.29.9.1已经被舍弃,于是共生成19个家族模板,以19个家族模板为基础构建本折叠类型模板.

折叠类型模板设计的流程如图3所示.

系统聚类是将多个样本分成若干类的方法,其基本思想是:先将所有n个样本看成不同的n类,然后将性质最接近(距离最近)的2类合并为1类,再从这n-1类中找到最接近的2类加以合并,依此类推,直到所有的样本被合为1类.两样本的合并与生成方法同2.1.利用TM-align结构比对程序给出的TM-score(或RMSD)参数作为距离指标,构建家族模板的系统聚类图.TM-score取值[0,1],值越高代表2样本结构越相似;RMSD越小,说明两样本结构越相似.依据TM-score的家族模板系统聚类图如图4所示,各分支点的对应的RMSD及TM-score参数如表2所示.英文字母代表形成的模板,例如a代表3.0家族和3.1家族形成的模板,字母顺序代表构建模板顺序.

由图4、表2可知:1)随着聚类的进行,RMSD总体呈现一个递增的趋势,TM-score总体呈现递减的趋势,这是由于模板之间的差异性逐渐变大所导致.2)模板间的RMSD都在4以内,TM-score都在0.5以上(r模板除外),说明模板间的稳定性良好,相似性良好.3)蛋白质的最先聚类是在超家族内部,而且具有很高的TM-score打分值以及较低的RMSD,如家族3.0和3.1,6.0和6.1,2.0和2.1的聚类,TM-score都在0.9以上并且RMSD在1.3以下,说明超家族内部的样本差异性小;其次聚类的是折叠相似的超家族之间,例如13.1和16.1、5.1和8.2,RMSD在2.4左右,打分值分别为0.79和 0.67,说明超家族之间的特异性逐渐变大.

为进一步检验家族模板聚类图稳定性,以RMSD为距离参数获得的家族模板系统聚类图如图5所示.各分支点的对应的RMSD及TM-score参数如表3所示.

表2 图4分支点对应的RMSD及TM-score的参数Table 2 Corresponding parameters of the RMSD and TM-score in Fig.4

表3 图5中各分支点对应的RMSD及TM-score参数Table 3 Corresponding parameters of the RMSD and TM-score in Fig.5

由图5可知:1)最先聚类是在超家族内部,而且具有很高的TM-score打分值以及较低的RMSD,与图4结果一致;2)与图4相比,图4中模板o所在聚类区间与图5中模板o所在聚类区间,都是由家族3.0、3.1、3.2、11.1聚类而成,其差别在于图5的家族8.1在模板n所在区间,家族7.1在图5中没有与任何模板聚类;3)图4中模板q所在的区间和图5中模板n所在的区间,都是由家族6.0、6.1、16.1、13.1、8.2、14.1、15.1、5.1、10.1、12.1、8.1、2.0、2.1聚类而成,只是聚类的顺序不同,差别在于家族8.1分别聚类在图4中模板o区间和图5中模板n区间,而家族17.1在图5中没有参与聚类.图4、5的总体差别在于家族8.1和家族8.2,2个家族都只有1个样本,其中a.29.8.1家族模板是由核磁共振结构建立的模板,而a.29.8.2家族是1个含有很长冗余的结构.通过以上对不同参数获得的家族模板聚类结果的分析可知,以TM-score为参数的聚类图稳定性很好,可以将TM-score的聚类结果作为本文的聚类依据.

2.3基于系统聚类图的Bromodomain-like折叠类型模板的选取标准

根据图4的TM-score系统聚类图,共生成a~r共18个模板,将各个模板对本折叠类型的52个样本及非本折叠类型的12 065个样本进行TM-algin比对,得到TM-score,并以TM-score的取值0.5作为阈值,当TM-score大于等于0.5时,待测蛋白与模板属于同一折叠类型,否则为不同折叠类型.计算各个模板用于折叠类型分类的识别率、MCC值及尤登指数[24],结果如表4所示.识别率、MCC值及尤登指数反映了设计模板用于折叠类型分类的有效性.

虽然各家族模板最终聚类为一个r模板,但是r模板在阈值为0.5时的识别率为所有模板中最低的,由于r模板的折叠核心片段较短,因此不能将r模板作为最后的折叠类型模板;处于各独立分枝中的最先聚类的模板识别率等指标相对较好.基于上述结果,并结合蛋白质折叠类型的确定标准,提出以下折叠类型模板筛选标准:1)模板的折叠核心片段清晰;2)模板分布于各独立分枝;3)模板的识别率在80%以上;4)模板由家族模板首次合并形成.满足以上4个标准的只有4个模板,分别为c、d、h、j模板,将这4个模板作为折叠类型模板.如图6所示,为各个待选模板和r模板的骨架模型.

表4 各个模板的识别率及MCC值、尤登指数对比Table 4 Recognition rate and MCC value,Youden index of each template

3 设计方法分析及讨论

3.1模板坐标提取方法的讨论

利用结构匹配的α-碳原子三维坐标提取模板相应的α-碳原子坐标,模板的α-碳原子坐标应该体现匹配的α-碳原子三维坐标的聚集性.本文中均值这一反映聚集性的参数建立了模板坐标提取方法.在统计学中反映一组数据聚集性的参数还有调和均值、几何均值和中位数等,分别利用上述3参数同样可以建立模板坐标提取方法.不同模板坐标提取方法得到的模板是否具有同一性?

为检验模板坐标提取方法对提取模板的影响,以一个家族模板的生成为例做了检验,检验结果表明,不同方法得到的模板坐标的差别不具有统计学意义.

具体检验过程如下:

选取a.29.2.1家族的4个样本,分别为d1e6ia_、d1eqfa1、d1eqfa2、d3p1fa_,运行MUSTANG程序后得到的匹配位点为113个,分别依靠调和均值、几何均值、均值和中位数得到4个对应模板.将4个样本的X、Y、Z坐标分别同4个模板的三维坐标X、Y、Z进行极距分布分析,得到极距值.表5为各个样本与模板间的平均极距值.

由表5可知,在X坐标下,4个模板的极距值分布相差不大,但调和均数模板和中位数模板相对较好,其极距值值偏低,在Y坐标和Z坐标下,调和均数模板、均值模板、几何均数模板的全局值相等,而中位数模板平均极距值除去在样本3处偏高之外,在其他样本处都偏低,说明中位数模板较其他3类模板稳定.综合X、Y、Z三个坐标下的平均极距值分布,得到中位数模板较为稳定.

本文对其三维坐标的平均极距值进行单因素方差分析,检验不同模板是否对平均极距值有差异.方差分析的前提是在各个水平下的总体服从方差相等的正态分布,正态分布的要求并不是很严格,但方差相等的要求是比较严格的.本文方差相等的检验方法是homogeneity of variance test方法,该方法是统计推断的方法,其零假设是各水平下总体方差没有显著差异,本实验显著水平选择0.05.如表6所示,为各个坐标的单因素方差结果.

表5 各个样本与模板间的平均极距值Table 5 Average interpolar distance between each sample and the template

表6 各个坐标的平均极距值的单因素方差分析Table 6 Single factor analysis of variance of average value of each coordinate distance

在X坐标下相伴概率为0.982,大于显著性差异0.05,可以认为各个组总体方差是相等的,满足方差检验的前提条件.方差检验的F值为0.153,相伴概率为0.926,相伴概率大于显著水平0.05,表示4种模板在X坐标下的平均极距值无明显区别,即4种模板无显著差别.同样的,分别在满足方差检验的前提条件下,本实验对Y和Z坐标分别计算其相伴概率,分别为0.955和0.989,都大于显著差异0.05,说明4中模板在Y和Z坐标下的平均极距值无明显差别,4种模板无显著差别.

3.2模板提取数量及参数约束的讨论

折叠类型模板的筛选主要受折叠核心片段的组成、在系统聚类图中的分布、位置及模板的识别率限制.由表3的各个模板的识别率可知,当降低识别率到70%,能筛选出e模板和k模板,识别率分别为69.2%和76.9%,通过计算Matthew相关系数分别为0.29和0.33,尤登指数分别为0.67和0.75.Matthew相关系数反应真阳性和真阴性的相关程度,Matthew相关系数越大说明模板对于区分真阴性和真阳性的能力越好.尤登指数是敏感性和特异性之和减1,指数介于0~1,表示筛选方法发现本折叠类型样本和非本折叠类型样本的总能力,指数越大表示模板真实性越高.e模板和k模板的Matthew相关系数在0.3左右,尤登指数在0.8以下,2个值都较小,并且它们不是独立分支中的最先聚类形成的模板,与条件(4)违背.当降低识别率到60%,能筛选出g模板和l模板,其识别率分别为67.3%和63.5%,MCC值分别为0.28和0.27,尤登指数分别为0.65和0.61,2个模板MCC值和尤登指数较小,且g模板是由d模板聚类而成,即d模板信息包含g模板信息,那么g模板相比d模板是多余的模板,可以舍弃.l模板包含在c模板、d模板和h模板形成的聚类区间,也可以舍弃.当提高识别率到90%,c模板的识别率为80.8%而被舍弃,只能筛选出d、h和j模板,3个模板对折叠类型所属家族及超家族的覆盖度降低,模板的完备性不够.综合以上因素,将识别率定为80%.

3.3设计模板与天然模板的对比分析

为检验这4个设计模板的稳定性,分别统计了4个设计模板和4个天然模板间的等价α-碳原子之间的距离di,单位nm.

式中(xi,yi,zi)和(x0,y0,z0)分别代表2个匹配的α-碳原子的坐标.

将4个设计模板c、d、h、j进行MUSTANG多结构比对之后,匹配的α-碳原子有59个.计算任意两两匹配的α-碳原子之间的距离,得到分布图如图7所示.在设计模板c、d、h、j所在家族内,挑选冗余结构少的天然蛋白样本作为天然模板,分别为d1e6ia_、d2gsca1、d2bl8a1、d3qzta_,将这4个天然模板进行MUSTANG多结构比对,匹配的α-碳原子有70个,计算任意两两匹配的α-碳原子之间的距离,得到天然模板距离分布图,如图8所示.

由图7可知,设计模板间的距离成正态分布,其平均值为0.35 nm,平均值95%的置信区间为[0.33,0.37],标准差为2.0.其距离25%的分位点为0.22,50%的分位点为0.32,75%的分位点为0.43.由图8可知,天然模板间的距离成正态分布,其平均值为0.30 nm,平均值95%的置信区间为[0.37,0.42],标准差为2.7.均值25%的分位点是0.19,50%的分位点是0.35,75%的分位点是0.76.通过以上数值分析可知:在平均值方面,设计模板间距离均值较天然模板小;在标准差方面,设计模板距离标准差较天然模板小,说明设计模板间距离更加稳定;在分位点数值分布方面,分位点表示密度函数在小于该点时与坐标横轴围成的面积,当分位点相同时,坐标横轴数值越小说明密度函数越大,即图7、8中的纵轴百分比越大,百分比越大说明模板距离间距数值越多,模板稳定性高.设计模板在分位点为25%时,即面积为0.25时,所对应的横轴距离值为0.22,而天然模板在面积为0.25时所对应的距离值为0.18.除去距离25%分位点时设计模板比天然模板距离值大以外,在50%和75%分位点设计模板都比天然模板的距离值小,说明设计模板稳定性好.

综合以上分析,设计模板在各个方面参数都较天然模板小,说明设计模板的空间构象比天然模板更为稳定.

3.4模板的普适性与有效性分析

利用本文给出的方法,确定并提取BRD折叠类型的4个模板.每个模板结构均包含该折叠类型的4个折叠核心片段,片段的空间坐标反映了片段的取向及片段间的排布,即设计模板成功提取了该折叠类型的叠核心片段及其取向和排布信息,具备结构上的普适性;从图4的系统聚类图上可以看到:4个模板分布于各独立分支中,各自代表了其所属家族、超家族集团的结构特性,提取的4个设计模板代表了该折叠类型样本的共同属性;表4中,4个设计模板对所属折叠类型样本的识别率均在80%以上,将该模板用于蛋白质折叠类型分类是有效的.

4 结论

1)针对折叠类型分类中所选天然模板的普适性不足的问题,提出了Bromodomain-like折叠类型模板的设计方法,并用于该折叠类型的模板设计.

2)利用该模板设计方法设计的模板,具有普适性,克服了天然模板的单一性,并且可用于蛋白质折叠类型的分类.

[1]ZHANG Y,SKOLNICK J.Segment assembly,structure alignment and iterative simulation in protein structure prediction[J].Bmc Biology,2013,11(1):1-4.

[2]阎隆飞,孙之荣.蛋白质分子结构[M].北京:清华大学出版社,1999:211-213.

[3]ANFINSEN C B.Principles that govern the folding of protein chains.[J].Science,1973,181(4096):223-230.

[4]赵国屏.生物信息学[M].北京:科学出版社,2002: 160-164.

[5]BAKER D,SALI A.Protein structure prediction and structural genomics.[J].Science,2001,294(5540):93-96.

[6]LUO L,LI X.Recognition and architecture of the framework structure of protein[J].Proteins Structure Function&Bioinformatics,2000,39(1):9-25.

[7]张春霆.蛋白质结构分类与结构类预测研究[J].中国科学基金,2000(5):298-299.ZHANG C T.Protein structure classification and prediction of structural classes[J].Science Foundation in China,2000(5):298-299.(in Chinese)

[8]阎隆飞,孙之荣.蛋白质分子结构[M].北京:清华大学出版社,1999:67.

[9]CHOTHIA C.One thousand families for the molecular biologist[J].Nature,1992,357:543-544.

[10]WANG Z X.How many fold types of protein are there in nature?[J].ProteinsStructureFunction& Bioinformatics,1996,26(2):186-191.

[11]BAKER D.A surprising simplicity to protein folding.[J].Nature,2000,405(6782):39-42.

[12]KELLEY L A,MACCALLUM R M,STERNBERG M J.Enhanced genome annotation using structural profiles in the program 3D-PSSM.[J].Journal of Molecular Biology,2000,299(2):499-520.

[13]FILIPPAKOPOULOS P,KNAPP S.The bromodomain interaction module.[J].Febs Letters,2012,586(17): 2692-2704.

[14]DHALLUIN C,CARLSON J E,ZENG L,et al.Structureandligandofahistoneacetyltransferase bromodomain[J].Nature,1999,399(6735):491-496.

[15]CONWAY S J.Bromodomains:are readers right for epigenetic therapy?[J].AcsMedicinalChemistry Letters,2012,3(9):691-694.

[16]VOLLMUTH F,BLANKENFELDTW,GEYERM.Structures of the dual bromodomains of the P-TEFbactivating protein Brd4 at atomic resolution.[J].Journal of Biological Chemistry,2009,284(52):36547-36556.

[17]VIDLER L R,PANAGIS F,OLEG F,et al.Discovery of novel small-molecule inhibitors of BRD4 using structurebased virtualscreening[J].JournalofMedicinal Chemistry,2013,56(20):8073-8088.

[18]SHINDYALOV I N,BOURNE P E.Protein structure alignment by incremental combinatorial extension(CE)of the optimal path.[J].Protein Engineering,1998,11(9):739-747.

[19]HOLM L,PARK J.DaliLite workbench for protein structure comparison.[J].Bioinformatics,2000,16(6):566-567.

[20]KRISSINELEHK.Secondary-structurematching(SSM),a new tool for fast protein structure alignment in three dimensions[J].Acta Crystallogr D Biol Crystallogr,2004,60(12-1):2256-2268.

[21]ZHANG Y,SKOLNICK J.TM-align:a protein structure alignment algorithm based on the TM-score[J].Nucleic Acids Research,2005,33(6):2302-2309.

[22]KONAGURTHU A S,WHISSTOCK J C,STUCKEY P J,etal.MUSTANG:amultiplestructuralalignment algorithm[J].ProteinsStructureFunction& Bioinformatics,2006,64(3):559-574.

[23]KIFER I,NUSSINOV R,WOLFSON H J.GOSSIP:a method for fast and accurate global alignment of protein structure[J].Bioinformatics,2011,27(7):925-932.

[24]刘岳,李晓琴,徐海松,等.蛋白质折叠类型的分类建模与识别[J].物理化学学报,2009(12):2558-2564.LIU Y,LI X Q,XU H S,et al.Classification modeling and recognition of protein fold type[J].Acta Physico-Chimica Sinica,2009(12):2558-2564.(in Chinese)

(责任编辑 杨开英)

Design of a Bromodomain-like Folding Type Template

LI Xiaoqin,ZHANG Chuncheng
(College of Life Science and Bioengineering,Beijing University of Technology,Beijing 100124,China)

For the problem that the universal shortage of natural template for folding type classification,a design method of the Bromodomain-like folding type template was presented.52 Bromodomain-like folding type samples whose sequence similarity is less than 40%were chosen and the resolution was higher than 0.25 nm in the database of the SCOPe of astral 2.03.Based on the results of multiple structure alignment and data analysis,the design method of the folding type family template was established.The clustering graph of family template was constructed using the system clustering method,and the design of the template of the folding type was completed.Results show that the design templates have universality,and the templates can be used for protein folding type classification.

folding type classification;template design;structure comparison;system clustering

O 641

A

0254-0037(2016)10-1572-09

10.11936/bjutxb2015100078

2015-10-29

国家自然科学基金资助项目(21173014);北京市自然科学基金资助项目(4112010)

李晓琴(1966—),女,教授,主要从事生物信息学理论方面的研究,E-mail:lxq0811@bjut.edu.cn

猜你喜欢
识别率聚类模板
高层建筑中铝模板系统组成与应用
一种傅里叶域海量数据高速谱聚类方法
铝模板在高层建筑施工中的应用
特高大模板支撑方案的优选研究
一种改进K-means聚类的近邻传播最大最小距离算法
Inventors and Inventions
改进K均值聚类算法
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别